← การทดลอง

คู่มือสำหรับผู้อ่านทั่วไป อ้างอิงจาก P1_RC_GGL: การทดสอบการปิดวงอย่างเข้มงวดของพลวัตกาแล็กซีและเลนส์ความโน้มถ่วงอ่อน (v1.1)

รายงานต้นฉบับโดย Guanglin Tu | ฐานเวอร์ชัน: P1 v1.1 | สถานะ: บทอธิบายสาธารณะ / ไม่ใช่บทความผ่าน peer review
เอกสารเก็บถาวรที่เกี่ยวข้อง: Report DOI 10.5281/zenodo.18526334 | Reproduction package DOI 10.5281/zenodo.18526286

หมายเหตุการอ่าน

นี่คือบทอธิบาย ไม่ใช่รายงานวิชาการอีกฉบับหนึ่ง เอกสารนี้อ้างอิงรายงาน P1 ต้นฉบับ คงรูปและตารางสำคัญไว้ และเพิ่มคำอธิบายภาษาง่ายว่า “สิ่งนี้หมายความว่าอะไร” ในแต่ละจุดสำคัญ

เอกสารนี้อธิบายเฉพาะข้อสรุปที่ P1 ได้ภายใต้ชุดข้อมูล บัญชีพารามิเตอร์ และโปรโตคอลสถิติที่ระบุไว้: ในการทดสอบร่วมของเส้นโค้งการหมุนกาแล็กซี (RC) กับเลนส์ความโน้มถ่วงอ่อนระดับกาแล็กซี–กาแล็กซี (GGL) แบบจำลองการตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT ทำได้ดีกว่า baseline ขั้นต่ำ DM_RAZOR ที่ทดสอบในที่นี้อย่างชัดเจน

เอกสารนี้ไม่อ่าน P1 เป็นข้ออ้างว่า “ล้มล้างสสารมืด” P1 เป็นเพียงก้าวแรกของการทดลองชุด P มันทดสอบเพียงชั้นที่สังเกตได้หนึ่งชั้นของ EFT คือ “ฐานแรงโน้มถ่วงเฉลี่ย” ไม่ใช่เนื้อหาทั้งหมดของกรอบ EFT

0 | เข้าใจ P1 ใน 5 นาที: การทดสอบนี้กำลังทำอะไรอยู่

มอง P1 ได้ว่าเป็นการตรวจสอบความจริงข้ามโพรบ ไม่ได้ถามเพียงว่าแบบจำลองหนึ่งจะฟิตชุดข้อมูลเดียวได้หรือไม่ แต่ยกค่าที่อ่านได้จากแรงโน้มถ่วงสองแบบซึ่งต่างกันมากขึ้นมาวางบนโต๊ะตรวจสอบเดียวกัน: เส้นโค้งการหมุน (RC) อ่านพลวัตภายในจานกาแล็กซี ส่วนเลนส์ความโน้มถ่วงอ่อนระดับกาแล็กซี–กาแล็กซี (GGL) อ่านการตอบสนองแรงโน้มถ่วงเชิงฉายบนสเกลที่ใหญ่กว่า

ประโยคแกนกลางของ P1

P1 ยกระดับเกณฑ์เปรียบเทียบจาก “ฟิตโพรบหนึ่งได้ดีหรือไม่” ไปเป็น “ปิดวงข้ามโพรบได้หรือไม่” การทำได้ดีภายใต้การจับคู่ที่ถูกต้อง แล้วสัญญาณยุบตัวเมื่อใช้การจับคู่ที่สับเปลี่ยน คือสิ่งที่บอกว่าแบบจำลองอาจกำลังจับโครงสร้างแรงโน้มถ่วงที่ RC และ GGL มีร่วมกัน

ตาราง 0 | ตัวเลขหลักของ P1 และวิธีอ่านแบบภาษาง่าย

ตัวชี้วัด

วิธีอ่านใน P1 / P1A

ความหมายแบบภาษาง่าย

ΔlogL_total ของการฟิตร่วม

ในการเปรียบเทียบหลัก EFT สูงกว่า DM_RAZOR อยู่ 1155–1337

ช่องว่างคะแนนรวมของข้อมูลทั้งสองชุด; ค่ายิ่งมากหมายถึงคำอธิบายรวมที่ดีกว่า

ความแรงของการปิดวง ΔlogL_closure

ในการเปรียบเทียบหลัก EFT อยู่ที่ 172–281; DM_RAZOR อยู่ที่ 127

ความสามารถในการทำนาย GGL หลังอนุมานจาก RC เท่านั้น; ค่ายิ่งมากหมายถึงความสอดคล้องตนเองข้ามโพรบที่สูงขึ้น

shuffle ตัวควบคุมเชิงลบ

หลังสับเปลี่ยน RC-bin→GGL-bin สัญญาณการปิดวงของ EFT ลดลงเหลือ 6–23

หากความสอดคล้องที่ถูกต้องถูกทำลาย ข้อได้เปรียบควรหายไป; การลดลงยิ่งชัดก็ยิ่งช่วยตัดสัญญาณปลอมออก

การทดสอบแรงกดดันหลาย DM ใน P1A

DM 7+1 + DM_STD พร้อมคง EFT_BIN ไว้เป็นตัวควบคุม

P1A ไม่ดูเฉพาะ DM_RAZOR ขั้นต่ำ แต่ยกแขนงเสริม DM ที่มิติต่ำและตรวจสอบได้หลายแบบเข้าไว้ในโปรโตคอลการปิดวงเดียวกัน


1 | ทำไมต้องทำ P1: จักรวาลวิทยาระดับกาแล็กซีติดขัดตรงไหน

ปัญหาระดับกาแล็กซียังแก้ยาก เพราะความต้องการ “แรงโน้มถ่วง/มวลส่วนเพิ่ม” ไม่ได้เป็นเพียงปรากฏการณ์ของเส้นโค้งการหมุนเท่านั้น ข้อสังเกตจำนวนมากแสดงความเชื่อมโยงที่แน่นระหว่างสสารแบริออนที่มองเห็นได้ในกาแล็กซีกับค่าที่อ่านได้จริงจากพลวัตหรือเลนส์ สำหรับเส้นทางสสารมืด หมายความว่า dark halo, baryonic feedback, ประวัติการก่อรูปกาแล็กซี และ systematics เชิงสังเกตต้องประสานกันอย่างละเอียดมาก ส่วนเส้นทางแรงโน้มถ่วงที่ไม่พึ่งสสารมืด แบบจำลองจะดูดีเฉพาะบน RC ไม่พอ แต่ต้องรอดผ่านเลนส์อ่อน กฎสเกลระดับประชากร และตัวควบคุมเชิงลบด้วย

นี่คือเหตุผลที่ P1 ถูกออกแบบขึ้น มันไม่ได้เริ่มจากคำว่า “สสารมืดผิด” หรือ “EFT ต้องถูก” แต่หยิบข้ออ้างหนึ่งที่ทดสอบได้ขึ้นสู่โต๊ะตรวจสอบ: การตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT จะทิ้งสัญญาณที่ทำซ้ำได้และย้ายข้ามข้อมูลได้ใน การปิดวงข้ามโพรบ RC→GGL หรือไม่

ภูมิหลังวรรณกรรมภายนอก: ทำไมหน้าต่าง RC+GGL จึงสำคัญ

ความสัมพันธ์ความเร่งแนวรัศมี (RAR) ที่ McGaugh, Lelli และ Schombert เสนอในปี 2016 แสดงความสัมพันธ์ที่แน่นและมี scatter ต่ำ ระหว่างความเร่งที่สังเกตจากเส้นโค้งการหมุนกับความเร่งที่ทำนายจากสสารแบริออน สิ่งนี้ทำให้การ coupling ระหว่างแบริออนกับการตอบสนองแรงโน้มถ่วงกลายเป็นปัญหาที่ทฤษฎีระดับกาแล็กซีหลีกเลี่ยงไม่ได้

Brouwer et al. (2021) ใช้เลนส์ความโน้มถ่วงอ่อน KiDS-1000 ขยาย RAR ไปยังความเร่งต่ำกว่าและรัศมีใหญ่กว่า โดยเปรียบเทียบ MOND, Verlinde emergent gravity และแบบจำลอง LambdaCDM พวกเขายังชี้ว่าความต่างระหว่างกาแล็กซีชนิด early/late, gas halos และ galaxy–halo connections ยังเป็นโจทย์อธิบายสำคัญ

Mistele et al. (2024) อนุมานเส้นโค้งความเร็ววงกลมของกาแล็กซีโดดเดี่ยวจากเลนส์อ่อนต่อไปอีก และรายงานว่าไม่เห็นการลดลงชัดเจนจนถึงหลายร้อย kpc และแม้ใกล้ 1 Mpc โดยสอดคล้องกับ BTFR สิ่งนี้แสดงว่าเลนส์อ่อนกำลังกลายเป็นค่าที่อ่านจากภายนอกที่สำคัญสำหรับทดสอบการตอบสนองแรงโน้มถ่วงระดับกาแล็กซี

ดังนั้นคุณค่าของ P1 ไม่ใช่การเป็นงานแรกที่นำ RC กับ GGL มาคุยร่วมกัน แต่อยู่ที่การวางทั้งสองอย่างไว้ในโปรโตคอลที่ตรวจสอบได้ ซึ่งประกอบด้วยการจับคู่แบบคงที่ บัญชีพารามิเตอร์ การปิดวง RC-only→GGL ตัวควบคุมเชิงลบแบบ shuffle และการทดสอบแรงกดดันหลาย DM ใน P1A


2 | EFT ใน P1 หมายถึงอะไร: ไม่ใช่ทฤษฎีสนามเชิงประสิทธิผล

ในที่นี้ EFT หมายถึงทฤษฎีเส้นใยพลังงาน (Energy Filament Theory) ไม่ใช่ทฤษฎีสนามเชิงประสิทธิผล (Effective Field Theory) ที่คุ้นกันในฟิสิกส์ ในรายงานเทคนิค P1 มีการใช้ EFT อย่างจงใจให้จำกัด: ไม่ได้ส่งเข้าร่วมในฐานะทฤษฎีสมบูรณ์ขั้นสุดท้าย แต่ถูกบีบให้เป็นพารามิเตอร์ไรเซชันของ “การตอบสนองแรงโน้มถ่วงเฉลี่ย” ที่สังเกตได้ ฟิตได้ และหักล้างได้

พูดแบบตรงไปตรงมา P1 ยังไม่ได้อภิปรายแหล่งจุลภาคทั้งหมดของแรงโน้มถ่วงส่วนเพิ่ม และไม่ได้พยายามพิสูจน์กรอบ EFT ทั้งหมดในก้าวเดียว มันถามคำถามที่แคบกว่าและแข็งกว่า: หากมีการตอบสนองแรงโน้มถ่วงส่วนเพิ่มเฉลี่ยบางอย่างบนสเกลกาแล็กซี สิ่งนั้นจะอธิบาย RC ก่อน แล้วทำนาย GGL ต่อได้หรือไม่

P1 ทดสอบส่วนใดของ EFT

P1 ทดสอบ “ฐานแรงโน้มถ่วงเฉลี่ย”: การมีส่วนร่วมเฉลี่ยที่เสถียรทางสถิติและย้ายข้ามตัวอย่างได้

P1 ยังไม่แตะ stochastic / noise floor: ได้แก่เทอมสุ่ม ความต่างรายวัตถุ หรือ scatter เพิ่มเติมที่อาจเกิดจากกระบวนการผันผวนระดับจุลภาค

P1 ยังไม่อภิปรายกลไกจุลภาคเต็ม abundance, lifetime หรือข้อจำกัดจักรวาลวิทยาระดับโลก มันเป็นก้าวแรกของการทดลองชุด P ไม่ใช่คำตัดสินสุดท้าย


3 | แผนชุด P1: ทำไมต้องเริ่มจาก “ฐานเฉลี่ย”

ชุด P เข้าใจได้ว่าเป็นโปรแกรมสืบค้นเชิงสังเกตของ EFT มันไม่ได้วางทุกข้ออ้างไว้บนโต๊ะพร้อมกัน แต่แยกส่วนที่ข้อมูลสาธารณะทดสอบได้ตรงที่สุดออกมาก่อน P1 เริ่มจากเทอมเฉลี่ย: หากการตอบสนองแรงโน้มถ่วงเฉลี่ยยังปิดวง RC→GGL ไม่ได้ ก็ยังไม่มีทางเข้าที่มั่นคงสำหรับอภิปรายเทอมเสียงรบกวนหรือกลไกจุลภาคที่ซับซ้อนกว่า

ตาราง 1 | ตำแหน่งแบบเป็นชั้นของชุด P

ชั้น

คำถามที่ถาม

บทบาทใน P1

P1

การตอบสนองแรงโน้มถ่วงเฉลี่ยปิดวง RC→GGL ได้หรือไม่

คำถามหลักของรายงานฉบับนี้

P1A

ถ้าเสริมฝั่ง DM ให้แข็งขึ้น ข้อสรุปยังคงเสถียรหรือไม่

ภาคผนวก B: การทดสอบแรงกดดัน DM 7+1 + DM_STD

งานชุด P ระยะถัดไป

โปรโตคอลขยายไปสู่ข้อมูลมากขึ้น โพรบมากขึ้น และ systematics ที่ซับซ้อนขึ้นได้หรือไม่

ทิศทางงานในอนาคต

คำถามที่ลึกกว่า

เทอมเฉลี่ย เทอมเสียงรบกวน และกลไกจุลภาคเชื่อมกันอย่างไร

อยู่นอกขอบเขตข้อสรุปของ P1


4 | ข้อมูลคืออะไร: RC และ GGL บอกอะไรเราแต่ละอย่าง


4.1 เส้นโค้งการหมุน (RC): มาตรวัดความเร็วของจานกาแล็กซี

เส้นโค้งการหมุนบันทึกว่าก๊าซและดาวฤกษ์โคจรรอบศูนย์กลางกาแล็กซีเร็วเพียงใดในรัศมีต่าง ๆ ยิ่งเคลื่อนที่เร็ว รัศมีนั้นก็ต้องการแรงสู่ศูนย์กลางมากขึ้น ซึ่งหมายถึงแรงโน้มถ่วงเชิงประสิทธิผลที่แรงขึ้น P1 ใช้ฐานข้อมูล SPARC หลังการเตรียมข้อมูลแล้วรวมกาแล็กซี 104 แห่ง จุดข้อมูลความเร็ว 2,295 จุด และแบ่งเป็น 20 RC-bin


4.2 เลนส์ความโน้มถ่วงอ่อน (GGL): ตาชั่งแรงโน้มถ่วงบนสเกลใหญ่กว่า

เลนส์ความโน้มถ่วงอ่อนระดับกาแล็กซี–กาแล็กซีวัดว่ากาแล็กซีฉากหน้าทำให้แสงจากกาแล็กซีพื้นหลังโค้งเล็กน้อยอย่างไร มันสอดคล้องกับการตอบสนองแรงโน้มถ่วงเชิงฉายบนสเกลที่ใหญ่กว่า คล้ายสเกลฮาโล และไม่ขึ้นกับรายละเอียดพลวัตของก๊าซในจานกาแล็กซี P1 ใช้ข้อมูล GGL สาธารณะจาก KiDS-1000 / Brouwer et al. 2021: 4 bin มวลดาว, bin ละ 15 จุดรัศมี รวม 60 จุดข้อมูล พร้อมเมทริกซ์โควาเรียนซ์เต็ม


4.3 การจับคู่แบบคงที่: ทำไม 20 RC-bin → 4 GGL-bin จึงสำคัญ

P1 เชื่อม 20 RC-bin กับ 4 GGL-bin ด้วยกฎคงที่: แต่ละ GGL-bin สอดคล้องกับ RC-bin จำนวนห้า bin และเฉลี่ยแบบถ่วงน้ำหนักด้วยจำนวนกาแล็กซี การจับคู่นี้คงเดิมสำหรับทุกแบบจำลอง จึงเป็นข้อจำกัดแข็งทั้งต่อการทดสอบการปิดวงและการเปรียบเทียบอย่างเป็นธรรม

ทำไมจึงปรับการจับคู่ย้อนหลังไม่ได้

ถ้าอนุญาตให้เลือกย้อนหลังว่า RC-bin ใดสอดคล้องกับ GGL-bin ใด แบบจำลองอาจผลิตการปิดวงขึ้นมาได้ด้วยการจัดเรียงความสอดคล้องใหม่ P1 จึงล็อกการจับคู่ 20→4 ไว้ล่วงหน้า แล้วจงใจทำลายด้วยตัวควบคุมเชิงลบแบบ shuffle เพื่อทดสอบว่าสัญญาณการปิดวงพึ่งพาความสอดคล้องที่สมเหตุสมผลทางฟิสิกส์จริงหรือไม่


5 | แบบจำลองและวิธีการ: P1 กำลังเปรียบเทียบอะไรจริง ๆ


5.1 ฝั่ง EFT: การตอบสนองแรงโน้มถ่วงเฉลี่ยมิติต่ำ

ฝั่ง EFT ใช้เทอมความเร็วส่วนเพิ่มมิติต่ำเพื่อบรรยายการตอบสนองแรงโน้มถ่วงเฉลี่ย รูปร่างของเทอมส่วนเพิ่มถูกควบคุมด้วยฟังก์ชันเคอร์เนลไร้มิติ f(r/ℓ) โดย ℓ เป็นสเกลสากล และแอมพลิจูดกำหนดตาม RC-bin เคอร์เนลต่างชนิดแทนความชันตั้งต้น ความเร็วในการเปลี่ยนผ่าน และหางระยะไกลที่ต่างกัน เพื่อใช้เป็นการทดสอบแรงกดดันด้านความทนทาน


5.2 ฝั่ง DM: ต้องอ่านการเปรียบเทียบหลักกับภาคผนวก P1A แยกกัน

ในการเปรียบเทียบหลัก DM_RAZOR เป็น baseline แบบ NFW ที่ย่อส่วนและตรวจสอบได้: ใช้ความสัมพันธ์ c–M คงที่ และไม่รวม halo-to-halo scatter, adiabatic contraction, feedback core, ความไม่เป็นทรงกลม หรือเทอมสิ่งแวดล้อม ข้อดีคืออิสระถูกควบคุมและทำซ้ำได้ง่าย ข้อจำกัดคือมันแทน LambdaCDM หรือแบบจำลองฮาโลสสารมืดทั้งหมดไม่ได้

ด้วยเหตุนี้ ภาคผนวก B (P1A) จึงเปลี่ยนฝั่ง DM ให้เป็นชุดการทดสอบแรงกดดันมาตรฐาน โดยไม่เปลี่ยนการจับคู่ร่วมและโปรโตคอลการปิดวง แล้วค่อย ๆ เพิ่มแขนงเสริมมิติต่ำ เช่น SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m และ baseline รวม DM_STD พร้อมคง EFT_BIN ไว้เป็นตัวควบคุม อ่าน P1A ได้อย่างนี้: ไม่ได้เทียบกับ DM baseline ขั้นต่ำเพียงตัวเดียว แต่ยกกลไก DM ที่พบทั่วไปและตรวจสอบได้หลายแบบเข้ามาวัดด้วย “ไม้บรรทัดการปิดวง” อันเดียวกัน

ถ้อยคำข้อสรุปที่แม่นยำในเอกสารนี้

ข้อความหลัก: ชุด EFT ทำได้ดีกว่า DM_RAZOR ขั้นต่ำอย่างมีนัยสำคัญในการเปรียบเทียบหลัก

ภาคผนวก B / P1A: ภายใต้แขนงเสริม DM หลายแบบที่มิติต่ำและตรวจสอบได้ รวมถึงการทดสอบแรงกดดัน DM_STD การฟิตร่วมบางส่วนของ DM ดีขึ้น แต่ความแรงของการปิดวงไม่ได้ลบข้อได้เปรียบของ EFT_BIN

ดังนั้นถ้อยคำที่ปลอดภัยที่สุดคือ: ภายในข้อมูล การจับคู่ บัญชีพารามิเตอร์ และโปรโตคอลการปิดวงของ P1/P1A การตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT แสดงความสอดคล้องข้ามข้อมูลที่แข็งกว่า; สิ่งนี้ไม่เท่ากับการตัดแบบจำลองสสารมืดทั้งหมดออก


5.3 การทดสอบการปิดวง: ตรรกะการทดลองที่สำคัญที่สุดของ P1

1. ปรับแบบจำลองด้วย RC เท่านั้น เพื่อให้ได้ชุดตัวอย่าง posterior แบบ RC-only ชุดหนึ่ง

2. ไม่ปรับพารามิเตอร์ใหม่ด้วย GGL; ใช้ posterior จาก RC ไปทำนาย GGL โดยตรง

3. ใช้โควาเรียนซ์เต็มคำนวณคะแนนการทำนาย GGL ภายใต้การจับคู่ที่ถูกต้อง, logL_true

4. สุ่มสลับความสอดคล้อง RC-bin→GGL-bin แล้วคำนวณคะแนนตัวควบคุมเชิงลบ, logL_perm

5. นำสองค่านี้มาลบกันเพื่อได้ความแรงของการปิดวง: ΔlogL_closure = <logL_true> − <logL_perm>

อุปมาแบบง่าย

การทดสอบการปิดวงเหมือนการสอบซ้ำข้ามห้อง แบบจำลองเรียนรู้รูปแบบในห้องสอบ RC ก่อน แล้วไปตอบในห้องสอบ GGL หากมันเรียนรู้กฎร่วมจริง ไม่ใช่กลเม็ดเฉพาะที่ มันควรยังทำได้ดีเมื่อย้ายห้อง แต่ถ้าจงใจสับเปลี่ยนความสอดคล้องของห้องสอบ ข้อได้เปรียบก็ควรหายไป


5.4 ก่อนอ่านตารางเทคนิค: จับทางเข้า 4 จุดนี้ก่อน

ตาราง 5.4 | เส้นทางอ่านตารางเทคนิคแนวนอนชุดถัดไป

จุดเข้า

ดูอะไร

ทำไมจึงสำคัญ

ตาราง S1a

คะแนนรวมของการฟิตร่วม RC+GGL

ตอบว่า: เมื่อดูข้อมูลทั้งสองชุดพร้อมกัน คำอธิบายรวมของใครแข็งกว่า

ตาราง S1b

ความแรงของการปิดวง, shuffle, การสแกนความทนทาน

ตอบว่า: สิ่งที่ RC เรียนรู้ย้ายไป GGL ได้หรือไม่

ตาราง B0

นิยามแขนงเสริม DM หลายแบบใน P1A

ป้องกันไม่ให้ลดรูป P1 เหลือว่า “เทียบกับ DM_RAZOR ขั้นต่ำเท่านั้น”

ตาราง B1

ตารางคะแนนการปิดวงและการฟิตร่วมของ P1A

ตรวจว่าข้อได้เปรียบของการปิดวงหายไปหรือไม่หลังเสริม DM

หมายเหตุด้านรูปแบบ

หน้าถัดไปเปลี่ยนเป็นแนวนอนเพื่อรักษาตารางกว้างจากรายงานต้นฉบับไว้อย่างครบถ้วน โดยไม่ตัดคอลัมน์หรือบีบจนอ่านยาก เนื้อความหลักได้ให้วิธีอ่านสำหรับผู้อ่านทั่วไปไว้ก่อนแล้ว; ตารางเทคนิคแนวนอนมีไว้สำหรับผู้อ่านที่ต้องการตรวจตัวเลขและแขนงแบบจำลอง

รูป 0.1 | ภาพรวมเวิร์กโฟลว์การทดสอบการปิดวงของ P1

หมายเหตุ: โซ่ด้านบนคือ “การทดสอบการปิดวง” (ฟิตด้วย RC เท่านั้น → ใช้ posterior จาก RC ทำนาย GGL); โซ่ด้านล่างคือ “การฟิตร่วม” (ให้คะแนน RC+GGL พร้อมกัน) ด้านขวาเปรียบเทียบการจับคู่จริงกับการจับคู่ที่สับเปลี่ยน เพื่อได้ความแรงของการปิดวง ΔlogL


6 | ตารางเทคนิคสำคัญ: ตารางรายงานหลักและตาราง P1A

ตาราง S1a | ตัวชี้วัดการเปรียบเทียบหลักของการฟิตร่วม (RC+GGL, Strict; คงจากรายงานต้นฉบับ)

แบบจำลอง (workspace)

เคอร์เนล W

k

joint logL_total (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

ตาราง S1b | ตัวชี้วัดการปิดวงและความทนทาน (Strict; คงจากรายงานต้นฉบับ)

แบบจำลอง (workspace)

closure ΔlogL (true-perm)

ΔlogL หลัง shuffle ตัวควบคุมเชิงลบ

ช่วง ΔlogL ของการสแกน σ_int

ช่วง ΔlogL ของการสแกน R_min

ช่วง ΔlogL ของการสแกน cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

ตาราง B0 | นิยามแขนงเสริม DM ใน P1A (คงจากภาคผนวก B ของรายงานต้นฉบับ)

Workspace

โมเดล DM

พารามิเตอร์ใหม่ (≤1)

แรงจูงใจทางฟิสิกส์ (แกนหลัก)

หลักการทำงานจริง (เป็นมิตรต่อการตรวจสอบ)

DM_RAZOR

NFW (fixed c–M, no scatter)

baseline ฮาโล LambdaCDM ขั้นต่ำและตรวจสอบได้; ใช้เพื่อเปรียบเทียบอย่างเข้มงวดกับ EFT

การจับคู่ร่วมคงที่; บัญชีพารามิเตอร์เข้มงวด; ใช้เป็น baseline เพื่อการเปรียบเทียบสัมพัทธ์เท่านั้น

DM_RAZOR_SCAT

NFW + c–M scatter (legacy)

σ_logc

ยอมให้ความสัมพันธ์ c–M มี scatter; ประมาณด้วย log-normal scatter แบบพารามิเตอร์เดียว

≤1 พารามิเตอร์ใหม่; ยังใช้การจับคู่ร่วม; ใช้ closure gain เป็นเกณฑ์รับผ่าน

DM_RAZOR_AC

NFW + adiabatic contraction (legacy)

α_AC

การตกเข้าไปของแบริออนอาจขับการหดตัวเชิงอะเดียแบติกของฮาโล; ประมาณด้วยพารามิเตอร์ความแรงหนึ่งตัว

≤1 พารามิเตอร์ใหม่; ไม่เปลี่ยนการจับคู่; รายงานการเปลี่ยนแปลง AICc/BIC และ closure gain

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

feedback อาจสร้าง core ด้านใน; ประมาณด้วยสเกล core แบบพารามิเตอร์เดียว

≤1 พารามิเตอร์ใหม่; โปรโตคอลการปิดวง/ตัวควบคุมเชิงลบใช้เกณฑ์เดียวกัน; ไม่ตั้งให้การปรับปรุง RC-only เป็นเป้าหมายเดียว

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc (hier)

ลำดับชั้นที่มาตรฐานกว่า c_i∼logN(c(M_i), σ_logc); ส่งผลต่อ posterior ร่วมของ RC และ GGL

prior ระบุชัดเจน; latent c_i ถูก marginalize; ยังคงมิติต่ำและตรวจสอบได้

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

ใช้ core proxy แบบพารามิเตอร์เดียวแทนผลหลักของ baryonic feedback เพื่อหลีกเลี่ยงรายละเอียดการก่อดาวมิติสูง

อ้างอิงวรรณกรรมมาตรฐาน; ≤1 พารามิเตอร์ใหม่; ผูกกับการทดสอบการปิดวง

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear (GGL)

ดูดกลืน systematic สำคัญฝั่งเลนส์อ่อนด้วยพารามิเตอร์เชิงประสิทธิผล เพื่อลดความเสี่ยงที่จะตี systematics เป็นฟิสิกส์

nuisance ถูกลงบัญชีอย่างชัดเจน; ไม่อนุญาตให้ย้อนกลับไปกระทบ RC; ตัดสินผลโดยเน้นความทนทานของการปิดวง

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

นำข้อคัดค้านที่พบบ่อยที่สุดสามประเภทเข้า baseline มาตรฐานเดียวที่ยังคงมิติต่ำ

รายงานทั้งบัญชีพารามิเตอร์และเกณฑ์สารสนเทศ; การปิดวงเป็นตัวชี้วัดหลัก; ใช้เป็นตัวควบคุมป้องกันฝั่ง DM ที่แข็งที่สุด

ตาราง B1 | ตารางคะแนน P1A (ค่ายิ่งมากยิ่งดี; คงจากภาคผนวก B ของรายงานต้นฉบับ)

แขนงแบบจำลอง (workspace)

Δk

RC-only best logL_RC (Δ)

ความแรงของการปิดวง ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

วิธีอ่านตาราง B1 (ตารางคะแนน P1A)

• Δk: จำนวนองศาอิสระใหม่; ค่ายิ่งมากหมายถึงแบบจำลองซับซ้อนขึ้น ไม่ได้หมายความว่าดีขึ้นโดยอัตโนมัติ

• ให้ดูสองคอลัมน์เป็นหลัก: ความแรงของการปิดวง ΔlogL_closure(Δ) (ค่ายิ่งมากหมายถึงความสอดคล้องแบบย้ายข้ามสูงขึ้น) และ Joint best logL_total(Δ) (คะแนนรวมของการฟิตร่วม)

• ค่า (Δ) ในวงเล็บคือผลต่างเทียบกับ DM_RAZOR เพื่อให้เปรียบเทียบได้โดยตรง

• คำถามหลักของตารางนี้คือ เมื่อ DM baseline ถูก “เสริมอย่างสมเหตุสมผล” แล้ว ข้อได้เปรียบของการปิดวงจะหายไปหรือไม่

• เคล็ดลับการอ่าน: DM_STD ยกระดับคะแนนร่วมได้ชัดเจน แต่ความแรงของการปิดวงกลับลดลง; EFT_BIN ยังสูงกว่าในความแรงของการปิดวง

สรุปประโยคเดียว: ภายในชุดการเสริม DM ที่มิติต่ำและตรวจสอบได้นี้ การปรับปรุงการฟิตร่วมไม่ได้สร้างการปิดวงที่แข็งขึ้นโดยอัตโนมัติ; การปิดวง หรือความสามารถในการย้ายข้าม ยังเป็นเกณฑ์สำคัญ


7 | ควรอ่านผลหลักอย่างไร


7.1 การฟิตร่วม: เมื่อดูข้อมูลสองชุดพร้อมกัน EFT ได้คะแนนสูงกว่าในการเปรียบเทียบหลัก

ตาราง S1a และรูป S4 แสดงว่า ภายใต้ข้อมูลเดียวกัน การจับคู่ร่วมแบบเดียวกัน และขนาดพารามิเตอร์ใกล้เคียงกัน ชุด EFT มีค่า joint ΔlogL_total เทียบกับ DM_RAZOR อยู่ที่ 1155–1337 อ่านแบบง่ายคือ เมื่อใช้กฎให้คะแนนเดียวกันกับ RC และ GGL รวมกัน แบบจำลอง EFT ในการเปรียบเทียบหลักได้คะแนนรวมสูงกว่า


7.2 การทดสอบการปิดวง: สิ่งที่ P1 เน้นที่สุดคือ “การย้ายข้ามได้”

ความแรงของการปิดวงที่สูงหมายความว่า พารามิเตอร์ที่อนุมานจาก RC เท่านั้นสามารถทำนาย GGL ได้ดีกว่า โดยไม่กลับไปดู GGL ใหม่ ในรายงาน P1 ค่า ΔlogL_closure ของ EFT อยู่ที่ 172–281 ขณะที่ DM_RAZOR อยู่ที่ 127 ผลนี้สำคัญกว่าการพูดว่าแต่ละแบบจำลองฟิตข้อมูลของตัวเองได้ดี เพราะมันจำกัดอิสระของแบบจำลองบนชุดข้อมูลที่สอง


7.3 ตัวควบคุมเชิงลบ: ทำไม “สัญญาณยุบตัว” จึงเป็นเรื่องดี

เมื่อ P1 สุ่มสลับความสอดคล้องของกลุ่ม RC-bin→GGL-bin แล้ว สัญญาณการปิดวงของ EFT ลดลงมาอยู่ในช่วง 6–23 สำหรับผู้อ่านทั่วไป ขั้นตอนนี้คือการตรวจจับการโกง: ถ้าข้อได้เปรียบของการปิดวงเกิดจากโค้ด หน่วย การจัดการโควาเรียนซ์ หรือโชคจากการฟิตเท่านั้น การสับเปลี่ยนอาจยังให้ข้อได้เปรียบได้ แต่ผลจริงคือข้อได้เปรียบยุบตัว แสดงว่ามันพึ่งพาการจับคู่ที่ถูกต้อง

รูป S3 | ความแรงของการปิดวง (ค่ายิ่งมากยิ่งดี): ข้อได้เปรียบ log-likelihood เฉลี่ยสำหรับการทำนาย RC-only → GGL

วิธีอ่านรูปนี้

รูปนี้เป็นแกนกลางของ P1 แท่งยิ่งสูง ยิ่งหมายความว่าข้อมูลที่เรียนรู้จาก RC ย้ายไป GGL ได้ดีกว่า

ชุด EFT โดยรวมสูงกว่า DM_RAZOR แสดงถึงการปิดวงข้ามโพรบที่แข็งกว่าในการทดลอง “เรียน RC ก่อน แล้วทำนาย GGL”

รูป S4 | ข้อได้เปรียบการฟิตร่วม (ค่ายิ่งมากยิ่งดี): best logL_total ของ RC+GGL เทียบกับ DM_RAZOR

วิธีอ่านรูปนี้

รูปนี้แสดงคะแนนรวมหลังฟิต RC และ GGL ร่วมกัน

EFT ทุกตัวแปรอยู่สูงกว่า 0 อย่างชัดเจน แสดงว่าข้อได้เปรียบของ EFT ในการเปรียบเทียบหลักไม่ใช่ผลเฉพาะจุดเดียว แต่เป็นพฤติกรรมรวมของการวิเคราะห์ร่วม

รูป R1 | ตัวควบคุมเชิงลบ: สัญญาณการปิดวงลดลงชัดเจนหลังสับเปลี่ยนการจัดกลุ่ม

วิธีอ่านรูปนี้

รูปนี้แสดงว่า เมื่อสับเปลี่ยนความสัมพันธ์การแบ่ง bin RC↔GGL ที่ถูกต้อง สัญญาณการปิดวงจะลดลงอย่างรวดเร็ว

สิ่งนี้ทำให้ผล P1 ดูเหมือนความสอดคล้องจริงใน mapping ข้ามข้อมูล มากกว่าจะเป็นความบังเอิญเชิงตัวเลขที่ได้จาก mapping แบบใดก็ได้


8 | ความทนทานและตัวควบคุม: P1 หลีกเลี่ยงไม่ให้ดูเหมือนแค่ปรับพารามิเตอร์อย่างไร

คำถามธรรมชาติสำหรับรายงานเทคนิคคือ ข้อได้เปรียบมาจากการตั้งค่า noise หนึ่งแบบ ช่วงข้อมูลส่วนกลางหนึ่งช่วง การจัดการโควาเรียนซ์แบบหนึ่ง หรือการ overfit หรือไม่ P1 ตอบด้วยการทดสอบแรงกดดันหลายชุด

ตาราง 2 | วิธีอ่านการทดสอบความทนทานและตัวควบคุมเชิงลบของ P1

การทดสอบ

คำถามที่ต้องการตัดออก

วิธีอ่าน

การสแกน σ_int

หากใน RC มี scatter ไม่ทราบที่มาเพิ่มเติม ข้อสรุปยังเสถียรหรือไม่

หลังผ่อนความคลาดเคลื่อนของ RC อันดับและสเกลข้อได้เปรียบของ EFT ยังเสถียร

การสแกน R_min

หากไม่ไว้วางใจบริเวณกลางกาแล็กซีอย่างเต็มที่ ข้อสรุปยังเสถียรหรือไม่

หลังตัดบริเวณศูนย์กลางออก EFT ยังรักษาข้อได้เปรียบเชิงบวกไว้

การสแกน cov-shrink

หากการประมาณโควาเรียนซ์ของ GGL ยังไม่แน่นอน ข้อสรุปยังเสถียรหรือไม่

หลังหดโควาเรียนซ์เข้าหาเมทริกซ์ทแยง ข้อได้เปรียบไม่ไวต่อการเปลี่ยนแปลง

ขั้นบันได ablation

EFT ได้เปรียบเพราะความซับซ้อนที่ไม่จำเป็นหรือไม่

EFT_BIN แบบเต็มมีความจำเป็นภายใต้เกณฑ์สารสนเทศ

การทำนายแบบ LOO เมื่อกันข้อมูลไว้

แบบจำลองอธิบายได้เฉพาะข้อมูลที่เคยเห็นหรือไม่

GGL bin ที่กันไว้ยังแสดงการ generalize ที่ค่อนข้างแข็ง

RC-bin shuffle

การปิดวงมาจาก mapping จริงหรือไม่

การปิดวงลดลงหลังสับเปลี่ยนกลุ่ม สนับสนุนว่ามันพึ่งพา mapping

รูป R2 | ช่วงของ ΔlogL_total ภายใต้การสแกน σ_int (ค่ายิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ตรวจว่าข้อได้เปรียบของ EFT ยังอยู่หรือไม่หลังเปลี่ยนสมมติฐาน scatter ภายในของ RC

รูป R3 | ช่วงของ ΔlogL_total ภายใต้การสแกน R_min (ค่ายิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ตรวจว่าข้อได้เปรียบของ EFT ยังเสถียรหรือไม่หลังตัดบริเวณศูนย์กลางที่ซับซ้อนออก

รูป R4 | ช่วงของ ΔlogL_total ภายใต้การสแกน cov-shrink (ค่ายิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ตรวจว่าอันดับไวต่อการเปลี่ยนแปลงการจัดการโควาเรียนซ์ของเลนส์อ่อนหรือไม่

รูป R5 | ขั้นบันได ablation ของ EFT_BIN (AICc; ค่ายิ่งน้อยยิ่งดี)

วิธีอ่านรูปนี้

ตรวจว่า EFT_BIN แบบเต็มจำเป็นต่อการอธิบายข้อมูลจริงหรือไม่ ไม่ใช่แค่เพิ่มพารามิเตอร์เปล่า ๆ

รูป R6 | LOO: การกระจาย log-likelihood ของ bin ที่กันไว้

วิธีอ่านรูปนี้

ตรวจว่าแบบจำลองยังทำนาย GGL bin ที่ไม่เคยเห็นได้หรือไม่

รูป R7 | ตัวควบคุมเชิงลบ: การจับคู่แบบ shuffle ทำให้ mean logL_true ของการปิดวงลดลงอย่างชัดเจน

วิธีอ่านรูปนี้

แสดงเพิ่มเติมจากมุมมอง mean logL_true ว่าการปิดวงพึ่งพาการจับคู่ข้ามข้อมูลที่ถูกต้อง


9 | P1A: ทำไม “มีแบบจำลอง DM หลายแบบในภาคผนวก” จึงเป็นการแก้ไขสำคัญ

ส่วนนี้ไม่ได้ถามว่า “EFT ชนะเพียง DM_RAZOR ขั้นต่ำตัวเดียวหรือไม่” แต่ถามว่า เมื่อเราเสริม DM baseline ภายในกรอบมิติต่ำ ทำซ้ำได้ และมีบัญชีพารามิเตอร์ชัดเจน (P1A) ข้อสรุปของการทดสอบการปิดวงและการฟิตร่วมจะเปลี่ยนไปหรือไม่ กล่าวอีกอย่าง P1A ลดข้อวิจารณ์ว่าเลือก DM baseline อ่อนเกินไป และพาการสนทนาไปสู่คำถามว่า ภายใต้ชุด DM ที่เสริมแล้วแต่ยังตรวจสอบได้ ผลงานด้านการปิดวงยังต่างกันอยู่หรือไม่

P1A ไม่ได้พยายามครอบคลุมความเป็นไปได้ทั้งหมดของการสร้างแบบจำลองฮาโลแบบ LambdaCDM และไม่ได้เปลี่ยนฝั่ง DM ให้เป็นตัวฟิตมิติสูงที่ตรวจสอบไม่ได้ มันเลือกการเสริมที่มิติต่ำ ทำซ้ำได้ และมีบัญชีพารามิเตอร์ชัดเจน ได้แก่ concentration scatter, adiabatic contraction, feedback core, hierarchical c–M scatter prior, ตัวแทน core แบบพารามิเตอร์เดียว, weak-lensing shear-calibration nuisance และแขนงรวม DM_STD

วิธีอ่านหลักของ P1A

ในสามแขนง legacy มีเพียง feedback/core ที่ให้ net gain เล็กน้อยต่อความแรงของการปิดวง; SCAT และ AC ไม่ให้ net closure gain

DM_HIER_CMSCAT, DM_RAZOR_M และ DM_CORE1P มีผลต่อความแรงของการปิดวงน้อยมาก หรือไม่แสดง net gain ที่มีนัยสำคัญ

DM_STD สามารถปรับปรุง joint logL ได้อย่างมาก แต่ความแรงของการปิดวงลดลง ชี้ว่ามันเพิ่มความยืดหยุ่นของการฟิตร่วมเป็นหลัก ไม่ใช่พลังทำนายแบบย้ายข้าม RC→GGL

ในตาราง B1 ของ P1A, EFT_BIN ยังรักษาความแรงของการปิดวงและข้อได้เปรียบการฟิตร่วมที่สูงกว่าไว้ ดังนั้นข้ออ้างแกนกลางของ P1 ไม่ควรถูกลดรูปเป็น “ชนะเฉพาะ DM_RAZOR ขั้นต่ำ”

รูป B1 | ตารางคะแนน P1A: closure และ joint ΔlogL เทียบกับ baseline (ค่ายิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

รูปนี้แสดงผลงานของแขนงเสริม DM หลายแบบเทียบกับ baseline

ความหมายของมันไม่ใช่ “ตัด DM ทั้งหมดออก” แต่แสดงว่า ภายในชุดการเสริม DM แบบมิติต่ำและตรวจสอบได้ที่ P1A เลือกไว้ การทำให้ DM แข็งขึ้นไม่ได้ลบข้อได้เปรียบด้านการปิดวงของ EFT_BIN


10 | ความหมายของการทดลอง P1: ทำไมเรื่องนี้จึงควรทำ


10.1 ความหมายเชิงวิธีวิทยา: ยกการปิดวงข้ามโพรบให้อยู่เหนือการฟิตโพรบเดี่ยว

ทฤษฎีระดับกาแล็กซีมักติดอยู่กับคำถามว่าแบบจำลองใดฟิตเส้นโค้งการหมุนชุดหนึ่งได้หรือไม่ P1 ยกระดับเกณฑ์ขึ้น: พารามิเตอร์ที่เรียนรู้จาก RC จะทำนายเลนส์อ่อนโดยไม่ปรับใหม่กับ GGL ได้หรือไม่ สิ่งนี้เปลี่ยน P1 จากการแข่งขันฟิตข้อมูลเป็นการทดสอบการทำนายแบบย้ายข้าม


10.2 ความหมายด้านความโปร่งใส: ถือห่วงโซ่การทำซ้ำได้ว่าเป็นส่วนหนึ่งของผลลัพธ์

ผลงานสำคัญอย่างหนึ่งของ P1 คือการเผยแพร่ข้อมูล ตารางและรูปภาพ run labels ตัวควบคุมเชิงลบ แพ็กเกจทำซ้ำ และห่วงโซ่ตรวจสอบไปพร้อมกัน สิ่งนี้สำคัญทั้งต่อผู้สนับสนุนและผู้วิจารณ์ เพราะการอภิปรายสามารถกลับไปยังข้อมูลสาธารณะชุดเดียวกัน การจับคู่ชุดเดียวกัน สคริปต์ชุดเดียวกัน และตัวชี้วัดชุดเดียวกัน แทนที่จะเปรียบเทียบแค่คำขวัญ


10.3 ความหมายทางฟิสิกส์: การทดสอบแรงกดดันที่หนักสำหรับแนวทางแรงโน้มถ่วงที่ไม่พึ่งสสารมืด

ในแนวทางแรงโน้มถ่วงที่ไม่พึ่งสสารมืด แบบจำลองจำนวนมากอธิบายปรากฏการณ์ของเส้นโค้งการหมุนหรือ RAR ได้บางส่วน งานที่ยากกว่าคือการผ่านค่าที่อ่านจากเลนส์อ่อนไปพร้อมกัน และแสดงด้วยตัวควบคุมเชิงลบว่าสัญญาณพึ่งพาการจับคู่ที่ถูกต้อง ความหมายของ P1 คือมันนำการตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT เข้าไปอยู่ในโปรโตคอลคล้ายการสอบภายนอก: RC เป็นสนามฝึก, GGL เป็นสนามย้ายข้าม, และ shuffle เป็นสนามตรวจจับการโกง


10.4 นี่เป็นการทดลองสำคัญสำหรับสาขาแรงโน้มถ่วงที่ไม่พึ่งสสารมืดหรือไม่

คำตอบอย่างระมัดระวังคือ หากการจัดการข้อมูล แพ็กเกจทำซ้ำ และโปรโตคอลการปิดวงของ P1 ยืนอยู่ได้ภายใต้การทบทวนจากภายนอก มันสามารถถูกมองเป็นการทดลองการปิดวง RC+GGL ที่ควรรับฟังอย่างจริงจังในงานวิจัยแรงโน้มถ่วงที่ไม่พึ่งสสารมืด / modified gravity ความสำคัญของมันไม่ได้อยู่ที่ประโยคว่า “ล้มล้างสสารมืด” แต่อยู่ที่การเสนอเกณฑ์ข้ามโพรบที่ทำซ้ำได้ ท้าทายได้ และขยายต่อได้

มีกรอบการปิดวงเชิงทำนาย RC+GGL ที่แข็งเท่ากันอยู่แล้วหรือไม่

มีกรอบที่เกี่ยวข้องและประเพณีการสังเกตอยู่แล้ว MOND/RAR จัดระเบียบปรากฏการณ์เส้นโค้งการหมุนจำนวนมากได้ดี งาน KiDS-1000 weak-lensing RAR ก็เปรียบเทียบ MOND, Verlinde emergent gravity และ LambdaCDM ส่วน LambdaCDM เองก็อธิบายปรากฏการณ์เลนส์อ่อน/พลวัตบางส่วนได้ผ่าน galaxy–halo connections, gas halos และ feedback modeling

แต่ข้ออ้างที่แม่นยำของ P1 ไม่ใช่ว่าไม่มีกรอบอื่นใดในโลกอธิบาย RC+GGL ได้ หากแต่คือ ภายใต้การจับคู่คงที่สาธารณะของ P1, การปิดวง RC-only→GGL, ตัวควบคุมเชิงลบแบบ shuffle, บัญชีพารามิเตอร์ และโปรโตคอลทดสอบแรงกดดันหลาย DM ของ P1A นั้น EFT รายงานผลงานการปิดวงที่แข็งกว่า

กล่าวอีกอย่าง สิ่งที่ควรถูกทดสอบจากภายนอกมากที่สุดใน P1 คือโปรโตคอลเปรียบเทียบที่เป็นรูปธรรมและทำซ้ำได้ ก้าวถัดไปที่มีคุณค่ามากคือทดสอบว่า MOND/RAR, LambdaCDM/HOD, hydrodynamical simulations หรือกรอบ modified gravity อื่น ๆ จะทำคะแนนการปิดวงเท่ากันหรือสูงกว่าได้หรือไม่ภายใต้โปรโตคอลเดียวกัน


11 | P1 สรุปอะไรได้ และสรุปอะไรไม่ได้

ตาราง 3 | ขอบเขตข้อสรุปของ P1

สรุปได้

ภายใต้ข้อมูล RC+GGL การจับคู่คงที่ และโปรโตคอลเปรียบเทียบหลักของ P1 ชุด EFT มีความแรงด้านการฟิตร่วมและการปิดวงสูงกว่า DM_RAZOR ขั้นต่ำ

สรุปได้

ภายในช่วงการเสริม DM ของ P1A ที่มิติต่ำและตรวจสอบได้ การเสริม DM หลายแบบไม่ได้ลบข้อได้เปรียบการปิดวงของ EFT_BIN

สรุปได้

ตัวควบคุมเชิงลบแบบ shuffle แสดงว่าสัญญาณการปิดวงพึ่งพาการจับคู่ข้ามข้อมูลที่ถูกต้อง และไม่ได้มาจาก mapping แบบใดก็ได้

สรุปไม่ได้

P1 ไม่ได้ล้มล้างแบบจำลองสสารมืดทั้งหมด P1A ยังไม่ครอบคลุมความไม่เป็นทรงกลม การพึ่งพาสิ่งแวดล้อม galaxy–halo connections ที่ซับซ้อน feedback มิติสูง หรือการจำลองจักรวาลวิทยาเต็มรูปแบบ

สรุปไม่ได้

P1 ไม่ได้พิสูจน์ทฤษฎี EFT เต็มจาก first principles มันทดสอบเพียงชั้นปรากฏการณ์วิทยาของการตอบสนองแรงโน้มถ่วงเฉลี่ย

สรุปไม่ได้

P1 ไม่ได้ตัด systematics ทั้งหมดออก มันให้หลักฐานความทนทานเฉพาะภายในชุดการทดสอบแรงกดดันและขอบเขตตรวจสอบที่ระบุไว้


12 | คำถามที่พบบ่อยสำหรับผู้อ่านทั่วไป

Q1: นี่หมายความว่า “สสารมืดไม่มีอยู่จริง” หรือไม่

ไม่ใช่ ข้อสรุปของ P1 ต้องจำกัดอยู่ในข้อมูล โปรโตคอล และแบบจำลองเปรียบเทียบที่ใช้ในที่นี้ P1A ก้าวเลย DM_RAZOR ขั้นต่ำไปแล้ว แต่ยังไม่แทนแบบจำลองสสารมืดที่เป็นไปได้ทั้งหมด

Q2: นี่หมายความว่า “EFT ได้รับการพิสูจน์แล้ว” หรือไม่

ก็ไม่ใช่เช่นกัน P1 ทดสอบ EFT ในฐานะพารามิเตอร์ไรเซชันของการตอบสนองแรงโน้มถ่วงเฉลี่ย และแสดงสมรรถนะการปิดวง RC→GGL ที่แข็งกว่า กลไกจุลภาคและทฤษฎีเต็มไม่ใช่ข้อสรุปของ P1

Q3: ทำไมไม่รายงานค่านัยสำคัญ σ โดยตรง

P1 ใช้คะแนน likelihood แบบรวม เกณฑ์สารสนเทศ และค่าต่างการปิดวง ΔlogL คือข้อได้เปรียบสัมพัทธ์ภายใต้กฎให้คะแนนเดียวกัน ไม่เท่ากับค่า σ ค่าเดียว

Q4: ทำไมต้องสับเปลี่ยนการจับคู่ RC-bin→GGL-bin

นี่คือตัวควบคุมเชิงลบ สัญญาณข้ามโพรบที่แท้จริงควรพึ่งพาการจับคู่ที่ถูกต้อง หากสับเปลี่ยนแล้วยังแรงเท่าเดิม นั่นกลับจะชี้ว่ามี bias จากการทำงานจริงหรือสิ่งประดิษฐ์ทางสถิติ

Q5: ก้าวต่อไปที่ P1 ควรทำมากที่สุดคืออะไร

ขยายโปรโตคอลเดียวกันไปสู่ข้อมูลที่มากขึ้น ตัวควบคุม DM ที่มากขึ้น systematics ที่ซับซ้อนขึ้น และกรอบ modified gravity ที่หลากหลายขึ้น โดยเฉพาะในรูปแบบที่ให้ทีมภายนอกทดสอบซ้ำได้ภายใต้ตัวชี้วัดการปิดวงเดียวกัน


13 | ศัพท์ย่อและคำสำคัญ

ตาราง 4 | ศัพท์ย่อและคำสำคัญ

คำศัพท์

คำอธิบายหนึ่งประโยค

เส้นโค้งการหมุน (RC)

ความสัมพันธ์รัศมี–ความเร็วในจานกาแล็กซี ใช้อนุมานแรงโน้มถ่วงเชิงประสิทธิผลภายในระนาบจาน

เลนส์ความโน้มถ่วงอ่อน (GGL)

วัดการกระจายเฉลี่ยของแรงโน้มถ่วง/มวลรอบกาแล็กซีฉากหน้า ผ่านการบิดเบี้ยวเชิงสถิติของรูปร่างกาแล็กซีพื้นหลัง

การทดสอบการปิดวง

ใช้ posterior จาก RC ทำนาย GGL แล้วเปรียบเทียบกับตัวควบคุมเชิงลบจาก mapping ที่สับเปลี่ยน

ตัวควบคุมเชิงลบ

จงใจทำลายโครงสร้างสำคัญเพื่อดูว่าสัญญาณหายไปหรือไม่ ใช้ตัดสัญญาณปลอม

ฮาโล NFW

โปรไฟล์ความหนาแน่นของฮาโลสสารมืดที่ใช้กันทั่วไปในแบบจำลองสสารมืดเย็น

ความสัมพันธ์ c–M

ความสัมพันธ์ระหว่างความเข้มข้นของฮาโล c กับมวล M; การยอมให้มี scatter ส่งผลต่อความยืดหยุ่นของแบบจำลอง

DM_STD

แขนงการทดสอบแรงกดดัน DM มาตรฐานใน P1A ที่รวมการเสริม DM มิติต่ำหลายแบบเข้ากับพารามิเตอร์ nuisance ของเลนส์

ΔlogL

ผลต่าง log-likelihood ระหว่างแบบจำลองสองแบบภายใต้กฎให้คะแนนเดียวกัน; ค่าบวกหมายถึงแบบแรกทำได้ดีกว่า

โควาเรียนซ์

คำอธิบายแบบเมทริกซ์ของความสัมพันธ์ระหว่างจุดข้อมูล; ข้อมูลเลนส์อ่อนมักต้องใช้เมทริกซ์โควาเรียนซ์เต็ม


14 | เส้นทางอ่านที่แนะนำและจุดเข้าอ้างอิง

1. อ่านส่วน 0–2 ก่อน เพื่อจับคำถามของ P1 และบทบาทที่จำกัดของ EFT ภายใน P1

2. จากนั้นอ่านรูป S3, รูป S4 และตาราง S1a/S1b เพื่อเข้าใจความแรงของการปิดวง การฟิตร่วม และตัวควบคุมเชิงลบ

3. หากกังวลว่า DM baseline อ่อนเกินไป ให้ไปที่ส่วน 9 และตาราง B1 / รูป B1 โดยตรง

4. หากต้องการตรวจสอบเชิงเทคนิค ให้กลับไปยังรายงานเทคนิค P1 v1.1, Tables & Figures Supplement และ full_fit_runpack

จุดเข้าเอกสารเก็บถาวรหลัก

รายงานเทคนิค P1 (ระดับเผยแพร่, Concept DOI): 10.5281/zenodo.18526334

แพ็กเกจทำซ้ำ P1 แบบเต็ม (Concept DOI): 10.5281/zenodo.18526286

ฐานความรู้ EFT แบบมีโครงสร้าง (ไม่บังคับ, Concept DOI): 10.5281/zenodo.18853200

หมายเหตุใบอนุญาต: รายงานเทคนิคใช้ CC BY-NC-ND 4.0; แพ็กเกจทำซ้ำเต็มใช้ CC BY 4.0 (ยึดตามรายงานเทคนิคและระเบียน Zenodo archive)


15 | เอกสารอ้างอิงและภูมิหลังภายนอก

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.