← การทดลอง

คำอธิบายรายงาน P1 — จากเส้นโค้งการหมุนถึงเลนส์ความโน้มถ่วงอย่างอ่อน: การทดสอบการตอบสนองความโน้มถ่วงเฉลี่ยของ EFT

คู่มือสำหรับผู้อ่านทั่วไป อ้างอิงจาก P1_RC_GGL: การทดสอบความปิดสอดคล้องอย่างเข้มงวดของพลวัตกาแล็กซีและเลนส์ความโน้มถ่วงอย่างอ่อน (v1.1)

รายงานต้นฉบับของผู้เขียน: Guanglin Tu | พื้นฐานเวอร์ชัน: P1 v1.1 | สถานะคำอธิบาย: ร่างคำอธิบายสำหรับสาธารณะ / ไม่ใช่บทความที่ผ่านการทบทวนโดยผู้ทรงคุณวุฒิ
คลังที่เกี่ยวข้อง: DOI รายงาน 10.5281/zenodo.18526334 | DOI แพ็กเกจทำซ้ำ 10.5281/zenodo.18526286

หมายเหตุการอ่าน

นี่คือฉบับอธิบาย ไม่ใช่รายงานวิชาการอีกฉบับหนึ่ง มันอ้างอิงจากรายงาน P1 ต้นฉบับ รักษารูปและตารางสำคัญไว้ และเพิ่มคำอธิบายภาษาง่ายในแต่ละขั้นตอนหลักว่ามันหมายความว่าอะไร

คู่มือนี้อธิบายเฉพาะข้อสรุปที่ P1 ได้ภายใต้ชุดข้อมูล บัญชีพารามิเตอร์ และโปรโตคอลสถิติที่กำหนดไว้: ในการทดสอบร่วมระหว่างเส้นโค้งการหมุนของกาแล็กซี (RC) กับเลนส์ความโน้มถ่วงอย่างอ่อนระหว่างกาแล็กซี (GGL) แบบจำลองการตอบสนองความโน้มถ่วงเฉลี่ยของ EFT ทำได้ดีกว่าเส้นฐาน DM_RAZOR ขั้นต่ำที่ทดสอบในที่นี้อย่างชัดเจน

คู่มือนี้ไม่ตีความ P1 ว่าเป็นข้ออ้างว่า “สสารมืดถูกล้มล้างแล้ว” P1 เป็นเพียงก้าวแรกของการทดลองชุด P มันทดสอบชั้นที่สังเกตได้ชั้นหนึ่งของ EFT คือ “ฐานความโน้มถ่วงเฉลี่ย” ไม่ใช่เนื้อหาทั้งหมดของกรอบ EFT ฉบับสมบูรณ์

0 | เข้าใจ P1 ใน 5 นาที: การทดสอบนี้กำลังทำอะไร?

อาจมอง P1 เป็นการทดสอบความสอดคล้องแบบข้ามโพรบ มันไม่ได้ถามเพียงว่าแบบจำลองหนึ่งจะฟิตชุดข้อมูลชุดเดียวได้หรือไม่ แต่ยกการอ่านค่าความโน้มถ่วงสองแบบที่ต่างกันมากขึ้นมาวางบนแท่นตรวจสอบเดียวกัน: เส้นโค้งการหมุน (RC) อ่านพลวัตภายในจานกาแล็กซี ส่วนเลนส์ความโน้มถ่วงอย่างอ่อนระหว่างกาแล็กซี (GGL) อ่านการตอบสนองความโน้มถ่วงแบบฉายบนสเกลที่ใหญ่กว่า

ใจความของ P1 ในประโยคเดียว

P1 ยกระดับเกณฑ์เปรียบเทียบจาก “ฟิตโพรบเดียวดีหรือไม่?” ไปสู่ “ปิดสอดคล้องข้ามโพรบได้หรือไม่?” แบบจำลองจะมีแนวโน้มจับโครงสร้างความโน้มถ่วงที่ RC และ GGL ใช้ร่วมกันได้จริง ก็ต่อเมื่อทำได้ดีภายใต้การแมปที่ถูกต้อง และสัญญาณพังลงหลังสลับการแมป

ตาราง 0 | ตัวเลขแกนกลางของ P1 และวิธีอ่านสำหรับผู้อ่านทั่วไป

ตัวชี้วัด

วิธีอ่านใน P1 / P1A

ความหมายในภาษาง่าย

การฟิตร่วม ΔlogL_total

ในการเปรียบเทียบหลัก EFT สูงกว่า DM_RAZOR อยู่ 1155–1337

ความต่างของคะแนนรวมระหว่างข้อมูลสองชุด; ยิ่งมากหมายถึงคำอธิบายโดยรวมยิ่งดี

ความแรงของการปิดสอดคล้อง ΔlogL_closure

ในการเปรียบเทียบหลัก EFT อยู่ที่ 172–281 ส่วน DM_RAZOR อยู่ที่ 127

ความสามารถในการทำนาย GGL หลังอนุมานจาก RC เพียงอย่างเดียว; ยิ่งมากหมายถึงความสอดคล้องข้ามโพรบยิ่งแข็งแรง

shuffle ควบคุมเชิงลบ

หลังสลับ RC-bin→GGL-bin สัญญาณการปิดสอดคล้องของ EFT ลดลงเหลือ 6–23

หากความสอดคล้องที่ถูกต้องถูกทำลาย ข้อได้เปรียบควรหายไป; ยิ่งพังลงชัด ยิ่งช่วยตัดสัญญาณลวงออกได้ดี

การทดสอบแรงกดดันหลาย DM ของ P1A

DM 7+1 + DM_STD โดยคง EFT_BIN ไว้เป็นตัวเปรียบเทียบ

P1A ไม่ได้ดูเฉพาะเส้นฐาน DM_RAZOR ขั้นต่ำ แต่ใส่แขนงเสริม DM หลายแบบที่มิติต่ำและตรวจสอบได้เข้าไปในโปรโตคอลการปิดสอดคล้องเดียวกัน


1 | ทำไมต้องทำ P1: จักรวาลวิทยาระดับกาแล็กซีกำลังติดขัดตรงไหน?

ปัญหาระดับกาแล็กซียังคงแก้ยากมานาน เพราะ “ความต้องการความโน้มถ่วง/มวลส่วนเกิน” ไม่ใช่เพียงปรากฏการณ์ของเส้นโค้งการหมุนเท่านั้น การสังเกตจำนวนมากแสดงความเชื่อมโยงแน่นแฟ้นระหว่างสสารแบริออนที่มองเห็นได้ในกาแล็กซีกับค่าที่อ่านได้จริงจากพลวัต/เลนส์ สำหรับเส้นทางสสารมืด นี่หมายความว่า ฮาโลมืด ฟีดแบ็กของแบริออน ประวัติการก่อรูปกาแล็กซี และระบบคลาดเคลื่อนเชิงสังเกต ต้องถูกประสานกันอย่างละเอียดมาก สำหรับเส้นทางความโน้มถ่วงที่ไม่อิงสสารมืด แบบจำลองไม่อาจดูดีเฉพาะบน RC ได้เท่านั้น แต่ต้องยังยืนอยู่ได้ในเลนส์ความโน้มถ่วงอย่างอ่อน ความสัมพันธ์สเกลระดับประชากร และการควบคุมเชิงลบด้วย

นี่คือแรงจูงใจของ P1 มันไม่ได้เริ่มจากคำว่า “สสารมืดผิด” หรือ “EFT ต้องถูก” แต่หยิบข้ออ้างที่ทดสอบได้หนึ่งข้อขึ้นมาตรวจสอบ: การตอบสนองความโน้มถ่วงเฉลี่ยของ EFT สามารถทิ้งสัญญาณที่ทำซ้ำได้และถ่ายโอนได้ไว้ในการปิดสอดคล้องแบบข้ามโพรบ RC→GGL หรือไม่?

บริบทวรรณกรรมภายนอก: ทำไมหน้าต่าง RC+GGL จึงสำคัญ

ความสัมพันธ์ความเร่งเชิงรัศมี (RAR) ที่ McGaugh, Lelli และ Schombert เสนอในปี 2016 แสดงความสัมพันธ์แน่นและมี scatter ต่ำ ระหว่างความเร่งที่สังเกตได้จากเส้นโค้งการหมุนกับความเร่งที่ทำนายจากสสารแบริออน สิ่งนี้ทำให้ “การควบคู่ระหว่างแบริออนกับการตอบสนองความโน้มถ่วง” เป็นประเด็นที่ทฤษฎีระดับกาแล็กซีหลีกเลี่ยงไม่ได้

Brouwer et al. (2021) ใช้เลนส์ความโน้มถ่วงอย่างอ่อนของ KiDS-1000 เพื่อขยาย RAR ไปยังความเร่งต่ำกว่าและรัศมีใหญ่กว่า พร้อมเปรียบเทียบ MOND, Verlinde emergent gravity และแบบจำลอง LambdaCDM พวกเขายังชี้ว่า ความแตกต่างระหว่างกาแล็กซีชนิดต้นและชนิดปลาย ฮาโลก๊าซ และความเชื่อมโยงกาแล็กซี–ฮาโล ยังคงเป็นปัญหาอธิบายที่สำคัญ

Mistele et al. (2024) ใช้เลนส์ความโน้มถ่วงอย่างอ่อนอนุมานเส้นโค้งความเร็ววงกลมของกาแล็กซีโดดเดี่ยวเพิ่มเติม และรายงานว่าไม่พบการลดลงชัดเจนไปจนถึงหลายร้อย kpc และแม้ราว 1 Mpc ซึ่งสอดคล้องกับ BTFR สิ่งนี้แสดงว่าเลนส์ความโน้มถ่วงอย่างอ่อนกำลังกลายเป็นค่าที่อ่านได้ภายนอกที่สำคัญสำหรับทดสอบการตอบสนองความโน้มถ่วงระดับกาแล็กซี

ดังนั้นคุณค่าของ P1 ไม่ได้อยู่ที่การเป็น “ครั้งแรกที่นำ RC และ GGL มาพูดถึงร่วมกัน” แต่อยู่ที่การนำทั้งสองเข้าไปไว้ในโปรโตคอลที่ตรวจสอบได้ ซึ่งประกอบด้วยการแมปคงที่ บัญชีพารามิเตอร์ การปิดสอดคล้องแบบ RC-only→GGL การควบคุมเชิงลบแบบ shuffle และการทดสอบแรงกดดันหลาย DM ของ P1A


2 | EFT ใน P1 หมายถึงอะไร? มันไม่ใช่ Effective Field Theory

ในที่นี้ EFT หมายถึง Energy Filament Theory (ทฤษฎีเส้นใยพลังงาน, EFT) ไม่ใช่ Effective Field Theory ที่พบได้ทั่วไปในฟิสิกส์ ในรายงานเทคนิค P1 การใช้ EFT เป็นไปอย่างระมัดระวัง: มันไม่ได้เข้าร่วมการเปรียบเทียบในฐานะทฤษฎีสุดท้ายที่ครบถ้วน แต่ถูกบีบอัดก่อนให้เป็นพารามิเตอร์ของ “การตอบสนองความโน้มถ่วงเฉลี่ย” ที่สังเกตได้ ฟิตได้ และหักล้างได้

พูดแบบภาษาทั่วไป P1 ไม่ได้เริ่มด้วยการถกแหล่งกำเนิดระดับจุลภาคทั้งหมดของความโน้มถ่วงส่วนเกิน และไม่ได้พยายามพิสูจน์กรอบ EFT ทั้งหมดในครั้งเดียว มันถามคำถามที่แคบกว่าและแข็งกว่า: หากมีการตอบสนองความโน้มถ่วงส่วนเกินแบบเฉลี่ยบางอย่างบนสเกลกาแล็กซี มันจะอธิบาย RC ก่อน แล้วถ่ายโอนไปทำนาย GGL ได้หรือไม่?

P1 ทดสอบส่วนใดของ EFT?

P1 มุ่งที่ “ฐานความโน้มถ่วงเฉลี่ย”: ผลสนับสนุนเฉลี่ยที่เสถียรทางสถิติและถ่ายโอนข้ามตัวอย่างได้

P1 ยังไม่จัดการกับ “ฐานสุ่ม/ฐานเสียงรบกวน”: พจน์สุ่ม ความแตกต่างรายวัตถุ หรือ scatter เพิ่มเติมที่กระบวนการผันผวนระดับจุลภาคกว่าอาจนำเข้ามา

P1 ยังไม่กล่าวถึงกลไกจุลภาคฉบับสมบูรณ์ ความชุก อายุขัย หรือข้อจำกัดจักรวาลวิทยาระดับโลก มันคือก้าวแรกของการทดลองชุด P ไม่ใช่คำตัดสินสุดท้าย


3 | แผนชุด P1: ทำไมก้าวแรกต้องเริ่มจาก “ฐานเฉลี่ย”?

ชุด P อาจเข้าใจได้ว่าเป็นโครงการค้นคืนเชิงสังเกตของ EFT มันไม่ได้กางทุกข้ออ้างออกมาพร้อมกัน แต่แยกส่วนที่ทดสอบด้วยข้อมูลสาธารณะได้ง่ายที่สุดออกมาก่อน กลยุทธ์ของ P1 คือทดสอบพจน์เฉลี่ยก่อน: หากการตอบสนองความโน้มถ่วงเฉลี่ยยังปิดสอดคล้องจาก RC ไปยัง GGL ไม่ได้ การถกพจน์เสียงรบกวนหรือกลไกจุลภาคที่ซับซ้อนกว่าก็ขาดประตูเข้าสู่ปัญหา

ตาราง 1 | ตำแหน่งแบบแบ่งชั้นของชุด P

ชั้น

คำถามที่ถาม

บทบาทใน P1

P1

การตอบสนองความโน้มถ่วงเฉลี่ยปิดสอดคล้องใน RC→GGL ได้หรือไม่?

คำถามหลักของรายงานปัจจุบัน

P1A

หากฝั่ง DM ถูกเสริมให้แข็งขึ้น ข้อสรุปยังมั่นคงหรือไม่?

ภาคผนวก B: การทดสอบแรงกดดัน DM 7+1 + DM_STD

งานชุด P ในอนาคต

โปรโตคอลนี้ขยายไปยังข้อมูลมากขึ้น โพรบมากขึ้น และระบบคลาดเคลื่อนซับซ้อนขึ้นได้หรือไม่?

ทิศทางงานในอนาคต

คำถามระดับลึกกว่า

พจน์เฉลี่ย พจน์เสียงรบกวน และกลไกจุลภาคเชื่อมกันอย่างไร?

อยู่นอกขอบเขตข้อสรุปของ P1


4 | ข้อมูลคืออะไร? RC และ GGL บอกอะไรเราบ้าง?


4.1 เส้นโค้งการหมุน (RC): “มาตรวัดความเร็ว” ภายในจานกาแล็กซี

เส้นโค้งการหมุนบันทึกว่าก๊าซและดาวโคจรรอบศูนย์กลางกาแล็กซีเร็วเพียงใดที่รัศมีต่าง ๆ ยิ่งหมุนเร็ว รัศมีนั้นก็ต้องการแรงสู่ศูนย์กลางที่แรงขึ้น และจึงหมายถึงความโน้มถ่วงเชิงผลที่แรงขึ้น P1 ใช้ฐานข้อมูล SPARC โดยมีการเตรียมข้อมูลที่รวมกาแล็กซี 104 แห่ง และจุดข้อมูลความเร็ว 2,295 จุด แบ่งเป็น 20 RC-bin


4.2 เลนส์ความโน้มถ่วงอย่างอ่อน (GGL): “ตาชั่งความโน้มถ่วง” บนสเกลที่ใหญ่กว่า

เลนส์ความโน้มถ่วงอย่างอ่อนระหว่างกาแล็กซีวัดว่ากาแล็กซีฉากหน้าทำให้แสงจากกาแล็กซีพื้นหลังเบี่ยงเล็กน้อยอย่างไร มันสอดคล้องกับการตอบสนองความโน้มถ่วงแบบฉายบนรัศมีที่ใหญ่กว่าในระดับฮาโล และไม่ขึ้นกับรายละเอียดพลวัตของก๊าซภายในกาแล็กซี P1 ใช้ข้อมูล GGL สาธารณะจาก KiDS-1000 / Brouwer et al. (2021): 4 bin ของมวลดาว แต่ละ bin มีจุดรัศมี 15 จุด รวม 60 จุดข้อมูล และใช้โควาเรียนซ์เต็มรูปแบบ


4.3 การแมปคงที่: ทำไม 20 RC-bin → 4 GGL-bin จึงสำคัญ?

P1 เชื่อม 20 RC-bin เข้ากับ 4 GGL-bin ด้วยกฎคงที่: GGL-bin แต่ละชุดสอดคล้องกับ 5 RC-bin และนำมารวมกันด้วยค่าเฉลี่ยถ่วงน้ำหนักตามจำนวนกาแล็กซี การแมปนี้คงเดิมสำหรับทุกแบบจำลอง และทำหน้าที่เป็นข้อจำกัดแข็งสำหรับการทดสอบการปิดสอดคล้องและการเปรียบเทียบที่เป็นธรรม

ทำไมจึงปรับการแมปภายหลังไม่ได้?

หากอนุญาตให้เลือกภายหลังว่า “RC-bin ใดสอดคล้องกับ GGL-bin ใด” แบบจำลองอาจสร้างการปิดสอดคล้องขึ้นมาเองด้วยการจัดความสอดคล้องใหม่ P1 จึงล็อกการแมป 20→4 ไว้ล่วงหน้า และจงใจทำลายมันด้วยการควบคุมเชิงลบแบบ shuffle เพื่อพิจารณาว่าสัญญาณการปิดสอดคล้องพึ่งความสอดคล้องที่สมเหตุสมผลทางฟิสิกส์จริงหรือไม่


5 | แบบจำลองและวิธีการ: P1 กำลัง “เปรียบเทียบอะไร” กันแน่?


5.1 ฝั่ง EFT: การตอบสนองความโน้มถ่วงเฉลี่ยมิติต่ำ

ฝั่ง EFT ใช้พจน์ความเร็วส่วนเกินมิติต่ำเพื่ออธิบายการตอบสนองความโน้มถ่วงเฉลี่ย รูปร่างของพจน์ส่วนเกินถูกควบคุมโดยฟังก์ชันเคอร์เนลไร้มิติ f(r/ℓ) โดย ℓ เป็นสเกลทั่วระบบ และแอมพลิจูดถูกกำหนดตาม RC-bin เคอร์เนลต่างชนิดแทนความชันเริ่มต้น ความเร็วการเปลี่ยนผ่าน และหางระยะไกลที่ต่างกัน ใช้สำหรับทดสอบความทนทานภายใต้แรงกดดัน


5.2 ฝั่ง DM: การเปรียบเทียบหลักในเนื้อหาและภาคผนวก P1A ต้องอ่านแยกกัน

ในการเปรียบเทียบหลักของเนื้อหา DM_RAZOR เป็นเส้นฐาน NFW แบบย่อส่วนและตรวจสอบได้: ใช้ความสัมพันธ์ c–M คงที่ และไม่รวม halo-to-halo scatter, adiabatic contraction, feedback core, ความไม่เป็นทรงกลม หรือพจน์สิ่งแวดล้อม จุดแข็งของการออกแบบนี้คือจำนวนองศาอิสระควบคุมได้และทำซ้ำง่าย จุดอ่อนคือมันไม่อาจแทน LambdaCDM ทั้งหมดหรือแบบจำลองฮาโลสสารมืดทั้งหมดได้

ดังนั้นในภาคผนวก B (P1A) ฝั่ง DM จึงถูกทำให้เป็นชุด “การทดสอบแรงกดดันมาตรฐาน” โดยไม่เปลี่ยนการแมปร่วมและโปรโตคอลการปิดสอดคล้อง P1A ค่อย ๆ เพิ่มแขนงเสริมมิติต่ำ เช่น SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m และเส้นฐานผสม DM_STD พร้อมคง EFT_BIN ไว้เป็นตัวเปรียบเทียบ กล่าวโดยย่อ P1A ไม่ใช่การเทียบกับเส้นฐาน DM ขั้นต่ำเพียงตัวเดียว แต่เป็นการวัดกลไก DM ที่พบได้ทั่วไปและตรวจสอบได้หลายชุดด้วย “ไม้บรรทัดการปิดสอดคล้อง” เดียวกัน

กรอบข้อสรุปที่แม่นยำซึ่งใช้ในบทความนี้

เนื้อหาหลัก: ตระกูล EFT ทำได้ดีกว่า DM_RAZOR ขั้นต่ำอย่างมากในการเปรียบเทียบหลัก

ภาคผนวก B / P1A: ภายใต้แขนงเสริม DM หลายแบบที่มิติต่ำและตรวจสอบได้ รวมทั้งการทดสอบแรงกดดัน DM_STD การฟิตร่วมบางส่วนของ DM ดีขึ้น แต่ความแรงของการปิดสอดคล้องไม่ได้ลบข้อได้เปรียบของ EFT_BIN

ดังนั้นถ้อยคำที่มั่นคงที่สุดคือ: ภายในขอบเขตข้อมูล การแมป บัญชีพารามิเตอร์ และโปรโตคอลการปิดสอดคล้องของ P1/P1A การตอบสนองความโน้มถ่วงเฉลี่ยของ EFT แสดงความสอดคล้องข้ามข้อมูลที่แข็งแรงกว่า; นี่ไม่เท่ากับการตัดแบบจำลองสสารมืดทั้งหมดออก


5.3 การทดสอบการปิดสอดคล้อง: ไวยากรณ์การทดลองที่สำคัญที่สุดของ P1

1. ฟิตโดยใช้เฉพาะ RC เพื่อให้ได้ชุดตัวอย่าง posterior แบบ RC-only

2. ไม่ปรับพารามิเตอร์ใหม่ด้วย GGL; ใช้ posterior จาก RC โดยตรงเพื่อทำนาย GGL

3. ใช้โควาเรียนซ์เต็มรูปแบบคำนวณคะแนนทำนาย GGL ภายใต้การแมปที่ถูกต้อง คือ logL_true

4. สุ่มสลับความสัมพันธ์ RC-bin→GGL-bin เพื่อคำนวณคะแนนควบคุมเชิงลบ logL_perm

5. นำสองค่านี้มาลบกันเพื่อได้ความแรงของการปิดสอดคล้อง: ΔlogL_closure = <logL_true> − <logL_perm>

อุปมาในภาษาง่าย

การทดสอบการปิดสอดคล้องเหมือนการสอบซ่อมข้ามสนามสอบ แบบจำลองเรียนรู้รูปแบบในสนามสอบ RC ก่อน แล้วไปตอบในสนามสอบ GGL หากมันเรียนรู้กฎร่วม ไม่ใช่ลูกเล่นเฉพาะที่ มันควรยังตอบได้ดีหลังเปลี่ยนสนาม; หากจงใจสลับความสอดคล้องระหว่างสนามสอบ ข้อได้เปรียบก็ควรหายไป


5.4 ก่อนอ่านตารางเทคนิค: จับสี่ประตูเข้าสำคัญไว้ก่อน

ตาราง 5.4 | เส้นทางอ่านตารางเทคนิคแนวนอนชุดถัดไป

จุดเข้า

ดูอะไร

ทำไมจึงสำคัญ

Table S1a

คะแนนรวมการฟิตร่วม RC+GGL

ตอบว่า: “เมื่อดูข้อมูลสองชุดร่วมกัน คำอธิบายโดยรวมของใครแข็งแรงกว่า?”

Table S1b

ความแรงของการปิดสอดคล้อง, shuffle และการสแกนความทนทาน

ตอบว่า: “สิ่งที่เรียนจาก RC ถ่ายโอนไปยัง GGL ได้หรือไม่?”

Table B0

นิยามแขนงเสริม DM หลายแบบใน P1A

ป้องกันไม่ให้ P1 ถูกลดทอนเป็น “เทียบกับ DM_RAZOR ขั้นต่ำเท่านั้น”

Table B1

สกอร์บอร์ดการปิดสอดคล้องและการฟิตร่วมของ P1A

ตรวจว่าข้อได้เปรียบด้านการปิดสอดคล้องหายไปหรือไม่หลังเสริม DM

หมายเหตุการจัดหน้า

หน้าถัดไปเริ่มใช้หน้าแนวนอนเพื่อรักษาตารางกว้างจากรายงานต้นฉบับไว้ครบถ้วน โดยไม่ลบคอลัมน์หรือบีบจนอ่านไม่ออก เนื้อหาหลักได้ให้การอ่านแบบภาษาทั่วไปไว้แล้ว; ตารางเทคนิคแนวนอนมีไว้สำหรับผู้อ่านที่ต้องตรวจค่าตัวเลขและแขนงแบบจำลอง

รูป 0.1 | เห็นเวิร์กโฟลว์การทดสอบการปิดสอดคล้องของ P1 ในภาพเดียว

หมายเหตุ: สายโซ่ด้านบนคือ “การทดสอบการปิดสอดคล้อง” (ฟิตเฉพาะ RC → ใช้ posterior จาก RC ทำนาย GGL); สายโซ่ด้านล่างคือ “การฟิตร่วม” (ให้คะแนน RC+GGL ร่วมกัน) ด้านขวาเปรียบเทียบการแมปจริงกับการแมปที่สลับแล้วเพื่อได้ความแรงของการปิดสอดคล้อง ΔlogL


6 | ตารางเทคนิคสำคัญ: ตารางหลักจากรายงานต้นฉบับและตาราง P1A

ตาราง S1a | ตัวชี้วัดการเปรียบเทียบหลักของการฟิตร่วม (RC+GGL, Strict; คงไว้จากรายงานต้นฉบับ)

แบบจำลอง (workspace)

เคอร์เนล W

k

logL_total ร่วม (best)

ΔlogL_total เทียบกับ DM

AICc

BIC

DM_RAZOR

ไม่มี

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

ไม่มี

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

ตาราง S1b | ตัวชี้วัดการปิดสอดคล้องและความทนทาน (Strict; คงไว้จากรายงานต้นฉบับ)

แบบจำลอง (workspace)

ΔlogL การปิดสอดคล้อง (true-perm)

ΔlogL หลัง shuffle ควบคุมเชิงลบ

ช่วง ΔlogL จากการสแกน σ_int

ช่วง ΔlogL จากการสแกน R_min

ช่วง ΔlogL จากการสแกน cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308

ตาราง B0 | นิยามแขนงเสริม DM ใน P1A (คงไว้จากภาคผนวก B ของรายงานต้นฉบับ)

Workspace

dm_model

พารามิเตอร์ใหม่ (≤1)

แรงจูงใจทางฟิสิกส์ (แกนกลาง)

หลักการนำไปใช้ (เป็นมิตรต่อการตรวจสอบ)

DM_RAZOR

NFW (c–M คงที่, ไม่มี scatter)

เส้นฐานฮาโล LambdaCDM ขั้นต่ำที่ตรวจสอบได้; ใช้เป็นตัวเปรียบเทียบเข้มงวดกับ EFT

การแมปร่วมคงที่; บัญชีพารามิเตอร์เข้มงวด; ใช้เป็น baseline เพื่อเปรียบเทียบสัมพัทธ์เท่านั้น

DM_RAZOR_SCAT

NFW + scatter ของ c–M (legacy)

σ_logc

ความสัมพันธ์ c–M มี scatter; ประมาณด้วย log-normal scatter หนึ่งพารามิเตอร์

พารามิเตอร์ใหม่ ≤1; ยังใช้การแมปร่วม; ใช้กำไรของการปิดสอดคล้องเป็นเกณฑ์รับผล

DM_RAZOR_AC

NFW + การหดตัวแบบอะเดียแบติก (legacy)

α_AC

การตกเข้าของแบริออนอาจทำให้ฮาโลเกิด adiabatic contraction; ประมาณด้วยความแรงหนึ่งพารามิเตอร์

พารามิเตอร์ใหม่ ≤1; การแมปไม่เปลี่ยน; รายงานการเปลี่ยนแปลง AICc/BIC และกำไรของการปิดสอดคล้อง

DM_RAZOR_FB

NFW + feedback core (legacy)

log r_core

ฟีดแบ็กอาจสร้าง core ภายใน; ประมาณด้วยสเกล core หนึ่งพารามิเตอร์

พารามิเตอร์ใหม่ ≤1; ใช้กรอบการปิดสอดคล้อง/ควบคุมเชิงลบเดียวกัน; การปรับปรุง RC-only ไม่ใช่เป้าหมายเดียว

DM_HIER_CMSCAT

scatter ของ c–M แบบลำดับชั้น + prior

σ_logc(hier)

รูปแบบลำดับชั้นมาตรฐานกว่า c_i∼logN(c(M_i),σ_logc); ส่งผลต่อ posterior ร่วมของ RC และ GGL

prior ชัดเจน; marginalize latent c_i; ยังคงมิติต่ำและตรวจสอบได้

DM_CORE1P

proxy core หนึ่งพารามิเตอร์ (ได้รับแรงบันดาลใจจาก coreNFW/DC14)

log r_core

ใช้ proxy core หนึ่งพารามิเตอร์แทนผลหลักของฟีดแบ็กแบริออน เพื่อหลีกเลี่ยงรายละเอียดการก่อดาวมิติสูง

อ้างวรรณกรรมมาตรฐาน; พารามิเตอร์ใหม่ ≤1; ผูกกับการทดสอบการปิดสอดคล้อง

DM_RAZOR_M

NFW + nuisance การปรับเทียบ shear ของเลนส์

m_shear(GGL)

ดูดซับระบบคลาดเคลื่อนสำคัญฝั่งเลนส์ความโน้มถ่วงอย่างอ่อนด้วยพารามิเตอร์เชิงผล ลดความเสี่ยงที่จะถือระบบคลาดเคลื่อนเป็นฟิสิกส์

บันทึก nuisance อย่างชัดเจน; ไม่อนุญาตให้ย้อนกลับไปมีผลต่อ RC; ตัดสินผลโดยเน้นความทนทานของการปิดสอดคล้อง

DM_STD

เส้นฐาน DM แบบมาตรฐาน (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

นำข้อโต้แย้งที่พบบ่อยที่สุดสามกลุ่มเข้ามาในเส้นฐานมาตรฐานที่ยังคงมิติต่ำ

รายงานบัญชีพารามิเตอร์และเกณฑ์สารสนเทศร่วมกัน; การปิดสอดคล้องเป็นตัวชี้วัดหลัก; ใช้เป็นตัวเปรียบเทียบป้องกัน DM ที่แข็งที่สุด

ตาราง B1 | สกอร์บอร์ด P1A (ยิ่งมากยิ่งดี; คงไว้จากภาคผนวก B ของรายงานต้นฉบับ)

แขนงแบบจำลอง (workspace)

Δk

RC-only best logL_RC (Δ)

ความแรงของการปิดสอดคล้อง ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

วิธีอ่านตาราง B1 (สกอร์บอร์ด P1A)

• Δk: องศาอิสระที่เพิ่มใหม่ (ยิ่งมากหมายถึงแบบจำลองซับซ้อนกว่า; ซับซ้อนกว่าไม่ได้หมายความว่าดีกว่าโดยอัตโนมัติ)

• ให้ดูสองคอลัมน์หลัก: ความแรงของการปิดสอดคล้อง ΔlogL_closure(Δ) (ยิ่งมากยิ่งสอดคล้องเชิงถ่ายโอนมากขึ้น) และ Joint best logL_total(Δ) (คะแนนรวมของการฟิตร่วม)

• ค่าในวงเล็บ (Δ) คือความต่างเมื่อเทียบกับ DM_RAZOR ทำให้เปรียบเทียบโดยตรงได้ง่ายขึ้น

• คำถามหลักของตารางนี้คือ ข้อได้เปรียบด้านการปิดสอดคล้องหายไปหรือไม่หลังเส้นฐาน DM ถูก “เสริมอย่างสมเหตุสมผล”

• คำแนะนำการอ่าน: DM_STD เพิ่มคะแนนร่วมอย่างชัดเจน แต่ความแรงของการปิดสอดคล้องกลับลดลง; EFT_BIN ยังคงสูงกว่าในความแรงของการปิดสอดคล้อง

สรุปในประโยคเดียว: ภายในชุดการเสริม DM ที่มิติต่ำและตรวจสอบได้นี้ การปรับปรุงการฟิตร่วมไม่ได้สร้างการปิดสอดคล้องที่แข็งแรงขึ้นโดยอัตโนมัติ; การปิดสอดคล้อง หรือความถ่ายโอนได้ ยังคงเป็นเกณฑ์สำคัญ


7 | ควรอ่านผลหลักอย่างไร?


7.1 การฟิตร่วม: เมื่อดูข้อมูลสองชุดพร้อมกัน คะแนนเปรียบเทียบหลักของ EFT สูงกว่า

ตาราง S1a และรูป S4 แสดงว่า ภายใต้ข้อมูลชุดเดียวกัน การแมปร่วมเดียวกัน และขนาดพารามิเตอร์ใกล้เคียงกัน ตระกูล EFT มีค่า ΔlogL_total ร่วมเท่ากับ 1155–1337 เมื่อเทียบกับ DM_RAZOR ผู้อ่านทั่วไปอาจเข้าใจได้ว่า ภายใต้กฎให้คะแนนเดียวกันที่ใช้กับ RC และ GGL ร่วมกัน แบบจำลองเปรียบเทียบหลักของ EFT ได้คะแนนรวมสูงกว่า


7.2 การทดสอบการปิดสอดคล้อง: สิ่งที่ P1 ต้องการเน้นมากที่สุดคือ “ความถ่ายโอนได้”

ความแรงของการปิดสอดคล้องที่สูงหมายความว่า พารามิเตอร์ที่อนุมานจาก RC เพียงอย่างเดียวสามารถทำนาย GGL ได้ดีกว่าโดยไม่ต้องย้อนกลับไปดู GGL อีก ในรายงาน P1 ค่า ΔlogL_closure ของ EFT อยู่ที่ 172–281 ขณะที่ DM_RAZOR อยู่ที่ 127 ผลนี้สำคัญกว่าการพูดว่า “แต่ละแบบจำลองฟิตข้อมูลของตนได้ดี” เพราะมันจำกัดเสรีภาพของแบบจำลองบนชุดข้อมูลที่สอง


7.3 การควบคุมเชิงลบ: ทำไม “สัญญาณพังลง” จึงเป็นเรื่องดี?

หลังจาก P1 สุ่มสลับความสัมพันธ์การจัดกลุ่ม RC-bin→GGL-bin สัญญาณการปิดสอดคล้องของ EFT ลดลงสู่ช่วง 6–23 สำหรับผู้อ่านทั่วไป ขั้นตอนนี้เหมือนการตรวจป้องกันการโกง: หากข้อได้เปรียบด้านการปิดสอดคล้องเกิดจากโค้ด หน่วย การจัดการโควาเรียนซ์ หรือความบังเอิญของการฟิต ข้อได้เปรียบอาจยังคงอยู่แม้ภายใต้ความสัมพันธ์ที่ถูกสลับ แต่ผลจริงคือข้อได้เปรียบพังลง แสดงว่ามันขึ้นกับการแมปที่ถูกต้อง

รูป S3 | ความแรงของการปิดสอดคล้อง (ยิ่งมากยิ่งดี): ข้อได้เปรียบของค่าเฉลี่ย log-likelihood สำหรับการทำนาย RC-only → GGL

วิธีอ่านรูปนี้

รูปนี้คือแกนกลางของ P1 แท่งยิ่งสูง แปลว่าข้อมูลที่เรียนจาก RC ถ่ายโอนไปยัง GGL ได้ยิ่งดี

ตระกูล EFT โดยรวมสูงกว่า DM_RAZOR แสดงถึงการปิดสอดคล้องข้ามโพรบของ EFT ที่แข็งแรงกว่าในการทดลอง “เรียน RC ก่อน แล้วทำนาย GGL”

รูป S4 | ข้อได้เปรียบของการฟิตร่วม (ยิ่งมากยิ่งดี): best logL_total ของ RC+GGL เมื่อเทียบกับ DM_RAZOR

วิธีอ่านรูปนี้

รูปนี้แสดงคะแนนรวมหลังรวม RC และ GGL เข้าด้วยกัน

แบบจำลอง EFT ทั้งหมดอยู่สูงกว่า 0 อย่างชัดเจน แสดงว่าข้อได้เปรียบของ EFT ในการเปรียบเทียบหลักไม่ใช่ผลเฉพาะจุดเฉพาะที่ แต่เป็นรูปแบบโดยรวมในการวิเคราะห์ร่วม

รูป R1 | การควบคุมเชิงลบ: สัญญาณการปิดสอดคล้องลดลงอย่างชัดเจนหลังสลับการจัดกลุ่ม

วิธีอ่านรูปนี้

รูปนี้แสดงว่า เมื่อความสัมพันธ์การแบ่ง bin ที่ถูกต้องของ RC↔GGL ถูกทำลาย สัญญาณการปิดสอดคล้องจะลดลงอย่างชัดเจน

สิ่งนี้ทำให้ผล P1 ดูเหมือนความสอดคล้องจริงในการแมปข้ามข้อมูล มากกว่าจะเป็นความบังเอิญเชิงตัวเลขที่ได้จากการแมปใด ๆ ก็ได้


8 | ความทนทานและตัวควบคุม: P1 หลีกเลี่ยงการเป็นเพียง “การฟิตที่ดูดี” อย่างไร?

ข้อท้าทายที่ยกขึ้นกับรายงานเทคนิคได้ง่ายที่สุดคือ ข้อได้เปรียบมาจากการตั้งค่าเสียงรบกวนบางแบบ การตัดข้อมูลบริเวณศูนย์กลางบางช่วง การจัดการโควาเรียนซ์บางวิธี หรือการฟิตเกินหรือไม่ P1 ตอบคำถามนี้ด้วยการทดสอบแรงกดดันหลายชุด

ตาราง 2 | วิธีอ่านการทดสอบความทนทานและการควบคุมเชิงลบของ P1

การทดสอบ

ข้อกังวลที่ต้องการตัดออก

วิธีอ่าน

การสแกน σ_int

หาก RC มี scatter ไม่ทราบเพิ่มขึ้น ข้อสรุปยังมั่นคงหรือไม่?

หลังผ่อนคลายค่าคลาดเคลื่อนของ RC ลำดับของ EFT และขนาดข้อได้เปรียบยังมั่นคง

การสแกน R_min

หากไม่เชื่อถือบริเวณศูนย์กลางกาแล็กซีทั้งหมด ข้อสรุปยังมั่นคงหรือไม่?

หลังตัดบริเวณศูนย์กลางออก EFT ยังรักษาข้อได้เปรียบเชิงบวกไว้ได้

การสแกน cov-shrink

หากการประมาณโควาเรียนซ์ของ GGL ไม่แน่นอน ข้อสรุปยังมั่นคงหรือไม่?

หลังหดโควาเรียนซ์เข้าหาเมทริกซ์ทแยง ข้อได้เปรียบไม่ไวต่อการเปลี่ยนแปลง

บันได ablation

EFT อาศัยความซับซ้อนที่ไม่จำเป็นเพื่อบังคับฟิตหรือไม่?

EFT_BIN ฉบับเต็มได้รับการสนับสนุนจากเกณฑ์สารสนเทศ

การทำนายแบบ LOO กันข้อมูลออก

แบบจำลองอธิบายได้เฉพาะข้อมูลที่เคยเห็นหรือไม่?

หลังกัน GGL bin ออก แบบจำลองยังแสดงความสามารถทั่วไปที่แข็งแรง

shuffle RC-bin

การปิดสอดคล้องมาจากการแมปจริงหรือไม่?

การปิดสอดคล้องลดลงหลังสลับการจัดกลุ่ม สนับสนุนการพึ่งพาการแมป

รูป R2 | ช่วงของ ΔlogL_total ภายใต้การสแกน σ_int (ยิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ทดสอบว่าข้อได้เปรียบของ EFT ยังอยู่หรือไม่ หลังเปลี่ยนสมมติฐาน scatter ภายในของ RC

รูป R3 | ช่วงของ ΔlogL_total ภายใต้การสแกน R_min (ยิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ทดสอบว่าข้อได้เปรียบของ EFT ยังมั่นคงหรือไม่ หลังตัดบริเวณศูนย์กลางที่ซับซ้อนออก

รูป R4 | ช่วงของ ΔlogL_total ภายใต้การสแกน cov-shrink (ยิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ทดสอบว่าการจัดอันดับไวต่อการเปลี่ยนแปลงวิธีจัดการโควาเรียนซ์ของเลนส์ความโน้มถ่วงอย่างอ่อนหรือไม่

รูป R5 | บันได ablation ของ EFT_BIN (AICc, ยิ่งน้อยยิ่งดี)

วิธีอ่านรูปนี้

ทดสอบว่า EFT_BIN ฉบับเต็มจำเป็นต่อการอธิบายข้อมูลหรือไม่ แทนที่จะเป็นเพียงการเพิ่มพารามิเตอร์โดยไม่จำเป็น

รูป R6 | LOO: การกระจาย log-likelihood ของ bin ที่กันออกไว้

วิธีอ่านรูปนี้

ทดสอบว่าแบบจำลองยังมีสมรรถนะทำนายบน GGL bin ที่ไม่เคยเห็นหรือไม่

รูป R7 | การควบคุมเชิงลบ: การแมปแบบ shuffled ทำให้ค่า mean logL_true ของการปิดสอดคล้องลดลงอย่างชัดเจน

วิธีอ่านรูปนี้

แสดงเพิ่มเติมจากมุมมองของ mean logL_true ว่า การปิดสอดคล้องขึ้นกับการแมปข้ามข้อมูลที่ถูกต้อง


9 | P1A: ทำไม “มีหลายแบบจำลอง DM ในภาคผนวก” จึงเป็นการแก้ไขสำคัญ?

ส่วนนี้ไม่ได้ถามว่า “EFT เอาชนะเพียงเส้นฐาน DM_RAZOR ขั้นต่ำตัวเดียวหรือไม่?” แต่ถามว่า เมื่อเส้นฐาน DM ถูกเสริมให้แข็งขึ้นภายในบัญชีพารามิเตอร์ที่มิติต่ำ ทำซ้ำได้ และบันทึกชัดเจน (P1A) ข้อสรุปของการทดสอบการปิดสอดคล้องและการฟิตร่วมจะเปลี่ยนหรือไม่ กล่าวอีกอย่าง P1A มุ่งลดข้อโต้แย้งว่า “คุณเพียงเลือกเส้นฐาน DM ที่อ่อนเกินไป” และผลักการสนทนาไปสู่คำถามว่า ภายใต้ชุดการเสริม DM ที่ตรวจสอบได้ พฤติกรรมการปิดสอดคล้องยังต่างกันอยู่หรือไม่

P1A ไม่ได้ออกแบบมาเพื่อกวาดความเป็นไปได้ทั้งหมดของการสร้างแบบจำลองฮาโล LambdaCDM และไม่ได้เปลี่ยนฝั่ง DM ให้กลายเป็นตัวฟิตมิติสูงที่ตรวจสอบไม่ได้ มันเลือกการเสริมที่มิติต่ำ ทำซ้ำได้ และมีบัญชีพารามิเตอร์ชัดเจน ได้แก่ scatter ของ concentration, adiabatic contraction, feedback core, hierarchical c–M scatter prior, proxy core แบบหนึ่งพารามิเตอร์, nuisance ของการปรับเทียบ shear ในเลนส์อ่อน และเส้นฐานผสม DM_STD

วิธีอ่านหลักของ P1A

ในสามแขนง legacy มีเพียง feedback/core ที่ทำให้ความแรงของการปิดสอดคล้องเพิ่มขึ้นสุทธิเล็กน้อย; SCAT และ AC ไม่ให้กำไรสุทธิด้านการปิดสอดคล้อง

DM_HIER_CMSCAT, DM_RAZOR_M และ DM_CORE1P ส่งผลต่อความแรงของการปิดสอดคล้องน้อยมาก หรือไม่แสดงการเพิ่มขึ้นสุทธิที่มีนัยสำคัญ

DM_STD สามารถปรับปรุง joint logL ได้มาก แต่ความแรงของการปิดสอดคล้องลดลง ชี้ว่ามันเพิ่มความยืดหยุ่นของการฟิตร่วมเป็นหลัก มากกว่าจะเพิ่มกำลังทำนายถ่ายโอน RC→GGL

EFT_BIN ยังคงรักษาความแรงของการปิดสอดคล้องและข้อได้เปรียบของการฟิตร่วมที่สูงกว่าไว้ในตาราง B1 ของ P1A; ดังนั้นข้ออ้างหลักของ P1 ไม่ควรถูกลดเหลือว่า “ชนะเฉพาะ DM_RAZOR ขั้นต่ำ”

รูป B1 | สกอร์บอร์ด P1A: ΔlogL ของการปิดสอดคล้องและการฟิตร่วมเทียบกับ baseline (ยิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

รูปนี้แสดงสมรรถนะของแขนงเสริม DM หลายแบบเมื่อเทียบกับ baseline

ความหมายของมันไม่ใช่ “DM ทั้งหมดถูกตัดออก” แต่คือ: ภายในช่วงการเสริม DM ที่มิติต่ำและตรวจสอบได้ซึ่ง P1A เลือกไว้ การเสริม DM ไม่ได้ลบข้อได้เปรียบด้านการปิดสอดคล้องของ EFT_BIN


10 | ทำไมการทดลอง P1 จึงสำคัญ


10.1 ความสำคัญเชิงวิธีวิทยา: วาง “การปิดสอดคล้องข้ามโพรบ” ไว้เหนือ “การฟิตโพรบเดียว”

ทฤษฎีระดับกาแล็กซีมักติดอยู่กับคำถามว่า แบบจำลองหนึ่งจะฟิตเส้นโค้งการหมุนชุดใดชุดหนึ่งได้หรือไม่ P1 ยกระดับคำถามขึ้นหนึ่งขั้น: พารามิเตอร์ที่เรียนรู้จาก RC จะทำนายเลนส์ความโน้มถ่วงอย่างอ่อนได้หรือไม่โดยไม่ต้องปรับให้เข้ากับ GGL อีก? สิ่งนี้เปลี่ยน P1 จาก “การแข่งขันฟิต” ให้เป็น “การทดสอบการทำนายแบบถ่ายโอน”


10.2 ความสำคัญด้านความโปร่งใส: ถือห่วงโซ่การทำซ้ำได้เป็นส่วนหนึ่งของผลลัพธ์

ผลงานสำคัญอย่างหนึ่งของ P1 คือการเผยแพร่ข้อมูล ตารางและรูป ป้ายชื่อการรัน การควบคุมเชิงลบ แพ็กเกจทำซ้ำ และห่วงโซ่ตรวจสอบไปพร้อมกัน สิ่งนี้สำคัญทั้งต่อผู้สนับสนุนและผู้วิจารณ์: การอภิปรายสามารถกลับไปยังข้อมูลสาธารณะชุดเดียวกัน การแมปชุดเดียวกัน สคริปต์ชุดเดียวกัน และตัวชี้วัดชุดเดียวกัน แทนที่จะเทียบกันเพียงคำขวัญ

10.3 ความสำคัญทางฟิสิกส์: การทดสอบแรงกดดันอย่างเข้มสำหรับทิศทาง “ความโน้มถ่วงที่ไม่อิงสสารมืด”

ในทิศทางความโน้มถ่วงที่ไม่อิงสสารมืด แบบจำลองจำนวนมากสามารถอธิบายบางส่วนของเส้นโค้งการหมุนหรือ RAR ได้ งานที่ยากกว่าคือยังต้องผ่านค่าที่อ่านได้จากเลนส์ความโน้มถ่วงอย่างอ่อน และแสดงภายใต้การควบคุมเชิงลบว่าสัญญาณขึ้นกับการแมปที่ถูกต้อง P1 สำคัญเพราะมันนำการตอบสนองความโน้มถ่วงเฉลี่ยของ EFT เข้าไปในโปรโตคอลที่คล้ายการสอบภายนอก: RC คือสนามฝึก GGL คือสนามถ่ายโอน และ shuffle คือสนามป้องกันการโกง


10.4 นี่เป็นการทดลองสำคัญสำหรับสาขา “ความโน้มถ่วงที่ไม่อิงสสารมืด” หรือไม่?

กล่าวอย่างระมัดระวัง: หากการประมวลผลข้อมูล แพ็กเกจทำซ้ำ และโปรโตคอลการปิดสอดคล้องของ P1 ยังยืนอยู่ได้ภายใต้การทบทวนจากภายนอก ก็อาจถือได้ว่าเป็นการทดลองการปิดสอดคล้อง RC+GGL ที่ควรเอาจริงเอาจังในทิศทางความโน้มถ่วงที่ไม่อิงสสารมืด / ความโน้มถ่วงแบบปรับแก้ ความสำคัญของมันไม่ได้อยู่ในคำขวัญว่า “สสารมืดถูกล้มล้าง” แต่อยู่ในการให้เกณฑ์ข้ามโพรบที่ทำซ้ำได้ ท้าทายได้ และขยายต่อได้

มีกรอบการปิดสอดคล้องเชิงทำนาย RC+GGL ในระดับเดียวกันอยู่แล้วหรือไม่?

มีกรอบและประเพณีเชิงสังเกตที่เกี่ยวข้องอยู่แล้ว: MOND/RAR จัดระเบียบปรากฏการณ์เส้นโค้งการหมุนจำนวนมากได้ดี; งาน RAR จากเลนส์ความโน้มถ่วงอย่างอ่อน KiDS-1000 ก็เปรียบเทียบ MOND, Verlinde emergent gravity และแบบจำลอง LambdaCDM; LambdaCDM เองก็อาจอธิบายปรากฏการณ์เลนส์ความโน้มถ่วงอย่างอ่อน/พลวัตบางส่วนผ่านความเชื่อมโยงกาแล็กซี–ฮาโล ฮาโลก๊าซ และการสร้างแบบจำลองฟีดแบ็ก

แต่ข้ออ้างที่แม่นยำของ P1 ไม่ใช่ว่า “ไม่มีกรอบอื่นใดในโลกอธิบาย RC+GGL ได้” หากแต่คือ ภายใต้โปรโตคอลสาธารณะของ P1 เอง — การแมปคงที่ การปิดสอดคล้อง RC-only→GGL การควบคุมเชิงลบแบบ shuffle บัญชีพารามิเตอร์ และการทดสอบแรงกดดันหลาย DM ของ P1A — EFT รายงานสมรรถนะการปิดสอดคล้องที่แข็งแรงกว่า

กล่าวอีกอย่าง ส่วนของ P1 ที่ควรได้รับการทดสอบจากภายนอกมากที่สุดคือโปรโตคอลเปรียบเทียบที่เป็นรูปธรรมและทำซ้ำได้ ขั้นต่อไปที่ควรทำอย่างยิ่งคือดูว่า MOND/RAR, LambdaCDM/HOD, การจำลองไฮโดรไดนามิก หรือกรอบความโน้มถ่วงแบบปรับแก้อื่น ๆ จะทำคะแนนการปิดสอดคล้องได้เท่ากันหรือสูงกว่าภายใต้โปรโตคอลเดียวกันหรือไม่


11 | P1 สรุปอะไรได้ และสรุปอะไรไม่ได้?

ตาราง 3 | ขอบเขตข้อสรุปของ P1

สรุปได้

ภายใต้ข้อมูล RC+GGL การแมปคงที่ และโปรโตคอลเปรียบเทียบหลักของ P1 ตระกูล EFT มีคะแนนการฟิตร่วมและความแรงของการปิดสอดคล้องสูงกว่า DM_RAZOR ขั้นต่ำ

สรุปได้

ภายในช่วงการเสริม DM ที่มิติต่ำและตรวจสอบได้ของ P1A การเสริม DM หลายแบบไม่ได้ลบข้อได้เปรียบด้านการปิดสอดคล้องของ EFT_BIN

สรุปได้

การควบคุมเชิงลบแบบ shuffle แสดงว่าสัญญาณการปิดสอดคล้องขึ้นกับการแมปข้ามข้อมูลที่ถูกต้อง และไม่ได้มาจากการแมปตามอำเภอใจ

สรุปไม่ได้

ไม่อาจกล่าวได้ว่า P1 ล้มล้างแบบจำลองสสารมืดทั้งหมดแล้ว P1A ยังไม่ครอบคลุมความไม่เป็นทรงกลม การพึ่งพาสิ่งแวดล้อม ความเชื่อมโยงกาแล็กซี–ฮาโลที่ซับซ้อน ฟีดแบ็กมิติสูง หรือการจำลองจักรวาลวิทยาฉบับสมบูรณ์

สรุปไม่ได้

ไม่อาจกล่าวได้ว่ากรอบ EFT ฉบับสมบูรณ์ได้รับการพิสูจน์จากหลักการแรกแล้ว P1 ทดสอบเฉพาะชั้นปรากฏการณ์วิทยาของการตอบสนองความโน้มถ่วงเฉลี่ย

สรุปไม่ได้

ไม่อาจกล่าวได้ว่าระบบคลาดเคลื่อนทั้งหมดถูกตัดออกแล้ว P1 ให้หลักฐานความทนทานเฉพาะภายในรายการทดสอบแรงกดดันและขอบเขตการตรวจสอบที่ระบุไว้


12 | คำถามที่พบบ่อยจากผู้อ่านทั่วไป

Q1: นี่กำลังบอกว่า “สสารมืดไม่มีอยู่” ใช่หรือไม่?

ไม่ใช่ ข้อสรุปของ P1 ต้องจำกัดอยู่ในขอบเขตข้อมูล โปรโตคอล และแบบจำลองเปรียบเทียบที่ใช้ที่นี่ P1A ก้าวไกลกว่า DM_RAZOR ขั้นต่ำแล้ว แต่ยังไม่แทนแบบจำลองสสารมืดที่เป็นไปได้ทั้งหมด

Q2: นี่กำลังบอกว่า “EFT ได้รับการพิสูจน์แล้ว” ใช่หรือไม่?

ก็ไม่ใช่เช่นกัน P1 ทดสอบ EFT ในฐานะพารามิเตอร์ของการตอบสนองความโน้มถ่วงเฉลี่ย และแสดงประสิทธิภาพที่แข็งแรงกว่าในการปิดสอดคล้อง RC→GGL; กลไกจุลภาคและทฤษฎีฉบับสมบูรณ์ไม่ใช่ข้อสรุปของ P1

Q3: ทำไมไม่รายงานค่านัยสำคัญเป็น σ โดยตรง?

P1 ใช้คะแนน likelihood แบบเดียวกัน เกณฑ์สารสนเทศ และความต่างของการปิดสอดคล้อง ΔlogL คือข้อได้เปรียบสัมพัทธ์ภายใต้กฎให้คะแนนเดียวกัน ไม่เท่ากับค่า σ ค่าเดียว

Q4: ทำไมต้อง shuffle RC-bin→GGL-bin?

นี่คือการควบคุมเชิงลบ สัญญาณข้ามโพรบจริงควรขึ้นกับการแมปที่ถูกต้อง หากหลัง shuffle แล้วยังแรงเท่าเดิม นั่นกลับชี้ว่าอาจมีอคติจากการนำไปใช้หรือสัญญาณลวงทางสถิติ

Q5: ขั้นต่อไปที่ P1 ควรทำมากที่สุดคืออะไร?

ขยายโปรโตคอลเดียวกันไปยังข้อมูลมากขึ้น การเปรียบเทียบ DM มากขึ้น ระบบคลาดเคลื่อนที่ซับซ้อนขึ้น และกรอบความโน้มถ่วงแบบปรับแก้มากขึ้น โดยเฉพาะในรูปแบบที่ให้ทีมภายนอกสามารถทดสอบซ้ำภายใต้ตัวชี้วัดการปิดสอดคล้องเดียวกัน


13 | พจนานุกรมย่อ

ตาราง 4 | พจนานุกรมย่อ

ศัพท์

คำอธิบายในหนึ่งประโยค

เส้นโค้งการหมุน (RC)

ความสัมพันธ์ระหว่างรัศมีกับความเร็วการหมุนในจานกาแล็กซี ใช้อนุมานความโน้มถ่วงเชิงผลภายในจาน

เลนส์ความโน้มถ่วงอย่างอ่อน (GGL)

การวัดการกระจายความโน้มถ่วง/มวลเฉลี่ยรอบกาแล็กซีฉากหน้า ผ่านการบิดเบี้ยวเชิงสถิติของรูปร่างกาแล็กซีพื้นหลัง

การทดสอบการปิดสอดคล้อง

ใช้ posterior จาก RC ทำนาย GGL แล้วเปรียบเทียบกับการควบคุมเชิงลบที่สร้างจากการแมปแบบ shuffled

การควบคุมเชิงลบ

จงใจทำลายโครงสร้างสำคัญเพื่อดูว่าสัญญาณหายไปหรือไม่; ใช้ตัดสัญญาณลวง

ฮาโล NFW

โปรไฟล์ความหนาแน่นของฮาโลสสารมืดที่ใช้ทั่วไปในแบบจำลองสสารมืดเย็น

ความสัมพันธ์ c–M

ความสัมพันธ์ระหว่าง concentration c กับมวล M ของฮาโลสสารมืด; การอนุญาตให้มี scatter หรือไม่ส่งผลต่อความยืดหยุ่นของแบบจำลอง

DM_STD

แขนงทดสอบแรงกดดัน DM แบบมาตรฐานใน P1A ซึ่งรวมการเสริม DM มิติต่ำหลายแบบเข้ากับพจน์ nuisance ของเลนส์

ΔlogL

ความต่าง log-likelihood ระหว่างสองแบบจำลองภายใต้กฎให้คะแนนเดียวกัน; ค่าบวกหมายถึงแบบแรกดีกว่า

โควาเรียนซ์

คำอธิบายเชิงเมทริกซ์ของความสัมพันธ์ระหว่างจุดข้อมูล; ข้อมูลเลนส์ความโน้มถ่วงอย่างอ่อนมักต้องใช้โควาเรียนซ์เต็มรูปแบบ


14 | เส้นทางอ่านที่แนะนำและช่องทางอ้างอิง

1. อ่านส่วน 0–2 ของคู่มือนี้ก่อน เพื่อสร้างความเข้าใจปัญหาของ P1 และตำแหน่งที่ EFT ใช้อย่างระมัดระวังใน P1

2. จากนั้นดูรูป S3 รูป S4 และตาราง S1a/S1b เพื่อเข้าใจความแรงของการปิดสอดคล้อง การฟิตร่วม และการควบคุมเชิงลบ

3. หากกังวลว่า “เส้นฐาน DM อ่อนเกินไปหรือไม่” ให้ไปดูส่วน 9 และตาราง B1 / รูป B1 โดยตรง

4. สำหรับการตรวจสอบทางเทคนิค ให้ย้อนกลับไปยังรายงานเทคนิค P1 v1.1, Tables & Figures Supplement และ full_fit_runpack

ช่องทางคลังหลัก

รายงานเทคนิค P1 (ระดับเผยแพร่, Concept DOI): 10.5281/zenodo.18526334

แพ็กเกจทำซ้ำฉบับเต็มของ P1 (Concept DOI): 10.5281/zenodo.18526286

ฐานความรู้เชิงโครงสร้าง EFT (ตัวเลือก, Concept DOI): 10.5281/zenodo.18853200

หมายเหตุใบอนุญาต: รายงานเทคนิคใช้ CC BY-NC-ND 4.0; แพ็กเกจทำซ้ำฉบับเต็มใช้ CC BY 4.0 (ให้ยึดรายงานเทคนิคและคลัง Zenodo เป็นแหล่งอ้างอิง)


15 | เอกสารอ้างอิงและบริบทภายนอก

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.