คำอธิบายรายงาน P1 — จากเส้นโค้งการหมุนถึงเลนส์ความโน้มถ่วงอ่อน: การทดสอบการตอบสนองแรงโน้มถ่วงเฉลี่ยของทฤษฎีเส้นใยพลังงาน (Energy Filament Theory, EFT)

← การทดลอง

คู่มือสำหรับผู้อ่านทั่วไป อ้างอิงจาก P1_RC_GGL: การทดสอบการปิดวงอย่างเข้มงวดของพลวัตกาแล็กซีและเลนส์ความโน้มถ่วงอ่อน (v1.1)

รายงานต้นฉบับโดย Guanglin Tu | ฐานเวอร์ชัน: P1 v1.1 | สถานะ: บทอธิบายสาธารณะ / ไม่ใช่บทความผ่าน peer review
เอกสารเก็บถาวรที่เกี่ยวข้อง: Report DOI 10.5281/zenodo.18526334 | Reproduction package DOI 10.5281/zenodo.18526286

หมายเหตุการอ่าน

นี่คือบทอธิบาย ไม่ใช่รายงานวิชาการอีกฉบับหนึ่ง เอกสารนี้อ้างอิงรายงาน P1 ต้นฉบับ คงรูปและตารางสำคัญไว้ และเพิ่มคำอธิบายภาษาง่ายว่า “สิ่งนี้หมายความว่าอะไร” ในแต่ละจุดสำคัญ

เอกสารนี้อธิบายเฉพาะข้อสรุปที่ P1 ได้ภายใต้ชุดข้อมูล บัญชีพารามิเตอร์ และโปรโตคอลสถิติที่ระบุไว้: ในการทดสอบร่วมของเส้นโค้งการหมุนกาแล็กซี (RC) กับเลนส์ความโน้มถ่วงอ่อนระดับกาแล็กซี–กาแล็กซี (GGL) แบบจำลองการตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT ทำได้ดีกว่า baseline ขั้นต่ำ DM_RAZOR ที่ทดสอบในที่นี้อย่างชัดเจน

เอกสารนี้ไม่อ่าน P1 เป็นข้ออ้างว่า “ล้มล้างสสารมืด” P1 เป็นเพียงก้าวแรกของการทดลองชุด P มันทดสอบเพียงชั้นที่สังเกตได้หนึ่งชั้นของ EFT คือ “ฐานแรงโน้มถ่วงเฉลี่ย” ไม่ใช่เนื้อหาทั้งหมดของกรอบ EFT

0 | เข้าใจ P1 ใน 5 นาที: การทดสอบนี้กำลังทำอะไรอยู่

มอง P1 ได้ว่าเป็นการตรวจสอบความจริงข้ามโพรบ ไม่ได้ถามเพียงว่าแบบจำลองหนึ่งจะฟิตชุดข้อมูลเดียวได้หรือไม่ แต่ยกค่าที่อ่านได้จากแรงโน้มถ่วงสองแบบซึ่งต่างกันมากขึ้นมาวางบนโต๊ะตรวจสอบเดียวกัน: เส้นโค้งการหมุน (RC) อ่านพลวัตภายในจานกาแล็กซี ส่วนเลนส์ความโน้มถ่วงอ่อนระดับกาแล็กซี–กาแล็กซี (GGL) อ่านการตอบสนองแรงโน้มถ่วงเชิงฉายบนสเกลที่ใหญ่กว่า

RC ทำหน้าที่เหมือนมาตรวัดความเร็ว: บอกเราว่าก๊าซและดาวฤกษ์โคจรรอบศูนย์กลางจานกาแล็กซีเร็วเท่าใดในรัศมีต่าง ๆ
GGL คล้ายตาชั่งมากกว่า: มันอนุมานการกระจายเฉลี่ยของแรงโน้มถ่วงหรือมวลรอบกาแล็กซีฉากหน้า จากการที่แสงพื้นหลังถูกทำให้โค้งเล็กน้อย
คำถามหลักของ P1 คือ แบบจำลองชุดเดียวกันจะเรียนรู้รูปแบบจาก RC ก่อน แล้วนำรูปแบบนั้นไปใช้กับ GGL โดยยังอธิบายได้สมเหตุสมผลหรือไม่

ประโยคแกนกลางของ P1

P1 ยกระดับเกณฑ์เปรียบเทียบจาก “ฟิตโพรบหนึ่งได้ดีหรือไม่” ไปเป็น “ปิดวงข้ามโพรบได้หรือไม่” การทำได้ดีภายใต้การจับคู่ที่ถูกต้อง แล้วสัญญาณยุบตัวเมื่อใช้การจับคู่ที่สับเปลี่ยน คือสิ่งที่บอกว่าแบบจำลองอาจกำลังจับโครงสร้างแรงโน้มถ่วงที่ RC และ GGL มีร่วมกัน

ตาราง 0 | ตัวเลขหลักของ P1 และวิธีอ่านแบบภาษาง่าย

ตัวชี้วัด	วิธีอ่านใน P1 / P1A	ความหมายแบบภาษาง่าย
ΔlogL_total ของการฟิตร่วม	ในการเปรียบเทียบหลัก EFT สูงกว่า DM_RAZOR อยู่ 1155–1337	ช่องว่างคะแนนรวมของข้อมูลทั้งสองชุด; ค่ายิ่งมากหมายถึงคำอธิบายรวมที่ดีกว่า
ความแรงของการปิดวง ΔlogL_closure	ในการเปรียบเทียบหลัก EFT อยู่ที่ 172–281; DM_RAZOR อยู่ที่ 127	ความสามารถในการทำนาย GGL หลังอนุมานจาก RC เท่านั้น; ค่ายิ่งมากหมายถึงความสอดคล้องตนเองข้ามโพรบที่สูงขึ้น
shuffle ตัวควบคุมเชิงลบ	หลังสับเปลี่ยน RC-bin→GGL-bin สัญญาณการปิดวงของ EFT ลดลงเหลือ 6–23	หากความสอดคล้องที่ถูกต้องถูกทำลาย ข้อได้เปรียบควรหายไป; การลดลงยิ่งชัดก็ยิ่งช่วยตัดสัญญาณปลอมออก
การทดสอบแรงกดดันหลาย DM ใน P1A	DM 7+1 + DM_STD พร้อมคง EFT_BIN ไว้เป็นตัวควบคุม	P1A ไม่ดูเฉพาะ DM_RAZOR ขั้นต่ำ แต่ยกแขนงเสริม DM ที่มิติต่ำและตรวจสอบได้หลายแบบเข้าไว้ในโปรโตคอลการปิดวงเดียวกัน

1 | ทำไมต้องทำ P1: จักรวาลวิทยาระดับกาแล็กซีติดขัดตรงไหน

ปัญหาระดับกาแล็กซียังแก้ยาก เพราะความต้องการ “แรงโน้มถ่วง/มวลส่วนเพิ่ม” ไม่ได้เป็นเพียงปรากฏการณ์ของเส้นโค้งการหมุนเท่านั้น ข้อสังเกตจำนวนมากแสดงความเชื่อมโยงที่แน่นระหว่างสสารแบริออนที่มองเห็นได้ในกาแล็กซีกับค่าที่อ่านได้จริงจากพลวัตหรือเลนส์ สำหรับเส้นทางสสารมืด หมายความว่า dark halo, baryonic feedback, ประวัติการก่อรูปกาแล็กซี และ systematics เชิงสังเกตต้องประสานกันอย่างละเอียดมาก ส่วนเส้นทางแรงโน้มถ่วงที่ไม่พึ่งสสารมืด แบบจำลองจะดูดีเฉพาะบน RC ไม่พอ แต่ต้องรอดผ่านเลนส์อ่อน กฎสเกลระดับประชากร และตัวควบคุมเชิงลบด้วย

นี่คือเหตุผลที่ P1 ถูกออกแบบขึ้น มันไม่ได้เริ่มจากคำว่า “สสารมืดผิด” หรือ “EFT ต้องถูก” แต่หยิบข้ออ้างหนึ่งที่ทดสอบได้ขึ้นสู่โต๊ะตรวจสอบ: การตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT จะทิ้งสัญญาณที่ทำซ้ำได้และย้ายข้ามข้อมูลได้ใน การปิดวงข้ามโพรบ RC→GGL หรือไม่

ภูมิหลังวรรณกรรมภายนอก: ทำไมหน้าต่าง RC+GGL จึงสำคัญ

ความสัมพันธ์ความเร่งแนวรัศมี (RAR) ที่ McGaugh, Lelli และ Schombert เสนอในปี 2016 แสดงความสัมพันธ์ที่แน่นและมี scatter ต่ำ ระหว่างความเร่งที่สังเกตจากเส้นโค้งการหมุนกับความเร่งที่ทำนายจากสสารแบริออน สิ่งนี้ทำให้การ coupling ระหว่างแบริออนกับการตอบสนองแรงโน้มถ่วงกลายเป็นปัญหาที่ทฤษฎีระดับกาแล็กซีหลีกเลี่ยงไม่ได้

Brouwer et al. (2021) ใช้เลนส์ความโน้มถ่วงอ่อน KiDS-1000 ขยาย RAR ไปยังความเร่งต่ำกว่าและรัศมีใหญ่กว่า โดยเปรียบเทียบ MOND, Verlinde emergent gravity และแบบจำลอง LambdaCDM พวกเขายังชี้ว่าความต่างระหว่างกาแล็กซีชนิด early/late, gas halos และ galaxy–halo connections ยังเป็นโจทย์อธิบายสำคัญ

Mistele et al. (2024) อนุมานเส้นโค้งความเร็ววงกลมของกาแล็กซีโดดเดี่ยวจากเลนส์อ่อนต่อไปอีก และรายงานว่าไม่เห็นการลดลงชัดเจนจนถึงหลายร้อย kpc และแม้ใกล้ 1 Mpc โดยสอดคล้องกับ BTFR สิ่งนี้แสดงว่าเลนส์อ่อนกำลังกลายเป็นค่าที่อ่านจากภายนอกที่สำคัญสำหรับทดสอบการตอบสนองแรงโน้มถ่วงระดับกาแล็กซี

ดังนั้นคุณค่าของ P1 ไม่ใช่การเป็นงานแรกที่นำ RC กับ GGL มาคุยร่วมกัน แต่อยู่ที่การวางทั้งสองอย่างไว้ในโปรโตคอลที่ตรวจสอบได้ ซึ่งประกอบด้วยการจับคู่แบบคงที่ บัญชีพารามิเตอร์ การปิดวง RC-only→GGL ตัวควบคุมเชิงลบแบบ shuffle และการทดสอบแรงกดดันหลาย DM ใน P1A

2 | EFT ใน P1 หมายถึงอะไร: ไม่ใช่ทฤษฎีสนามเชิงประสิทธิผล

ในที่นี้ EFT หมายถึงทฤษฎีเส้นใยพลังงาน (Energy Filament Theory) ไม่ใช่ทฤษฎีสนามเชิงประสิทธิผล (Effective Field Theory) ที่คุ้นกันในฟิสิกส์ ในรายงานเทคนิค P1 มีการใช้ EFT อย่างจงใจให้จำกัด: ไม่ได้ส่งเข้าร่วมในฐานะทฤษฎีสมบูรณ์ขั้นสุดท้าย แต่ถูกบีบให้เป็นพารามิเตอร์ไรเซชันของ “การตอบสนองแรงโน้มถ่วงเฉลี่ย” ที่สังเกตได้ ฟิตได้ และหักล้างได้

พูดแบบตรงไปตรงมา P1 ยังไม่ได้อภิปรายแหล่งจุลภาคทั้งหมดของแรงโน้มถ่วงส่วนเพิ่ม และไม่ได้พยายามพิสูจน์กรอบ EFT ทั้งหมดในก้าวเดียว มันถามคำถามที่แคบกว่าและแข็งกว่า: หากมีการตอบสนองแรงโน้มถ่วงส่วนเพิ่มเฉลี่ยบางอย่างบนสเกลกาแล็กซี สิ่งนั้นจะอธิบาย RC ก่อน แล้วทำนาย GGL ต่อได้หรือไม่

P1 ทดสอบส่วนใดของ EFT

P1 ทดสอบ “ฐานแรงโน้มถ่วงเฉลี่ย”: การมีส่วนร่วมเฉลี่ยที่เสถียรทางสถิติและย้ายข้ามตัวอย่างได้

P1 ยังไม่แตะ stochastic / noise floor: ได้แก่เทอมสุ่ม ความต่างรายวัตถุ หรือ scatter เพิ่มเติมที่อาจเกิดจากกระบวนการผันผวนระดับจุลภาค

P1 ยังไม่อภิปรายกลไกจุลภาคเต็ม abundance, lifetime หรือข้อจำกัดจักรวาลวิทยาระดับโลก มันเป็นก้าวแรกของการทดลองชุด P ไม่ใช่คำตัดสินสุดท้าย

3 | แผนชุด P1: ทำไมต้องเริ่มจาก “ฐานเฉลี่ย”

ชุด P เข้าใจได้ว่าเป็นโปรแกรมสืบค้นเชิงสังเกตของ EFT มันไม่ได้วางทุกข้ออ้างไว้บนโต๊ะพร้อมกัน แต่แยกส่วนที่ข้อมูลสาธารณะทดสอบได้ตรงที่สุดออกมาก่อน P1 เริ่มจากเทอมเฉลี่ย: หากการตอบสนองแรงโน้มถ่วงเฉลี่ยยังปิดวง RC→GGL ไม่ได้ ก็ยังไม่มีทางเข้าที่มั่นคงสำหรับอภิปรายเทอมเสียงรบกวนหรือกลไกจุลภาคที่ซับซ้อนกว่า

ตาราง 1 | ตำแหน่งแบบเป็นชั้นของชุด P

ชั้น	คำถามที่ถาม	บทบาทใน P1
P1	การตอบสนองแรงโน้มถ่วงเฉลี่ยปิดวง RC→GGL ได้หรือไม่	คำถามหลักของรายงานฉบับนี้
P1A	ถ้าเสริมฝั่ง DM ให้แข็งขึ้น ข้อสรุปยังคงเสถียรหรือไม่	ภาคผนวก B: การทดสอบแรงกดดัน DM 7+1 + DM_STD
งานชุด P ระยะถัดไป	โปรโตคอลขยายไปสู่ข้อมูลมากขึ้น โพรบมากขึ้น และ systematics ที่ซับซ้อนขึ้นได้หรือไม่	ทิศทางงานในอนาคต
คำถามที่ลึกกว่า	เทอมเฉลี่ย เทอมเสียงรบกวน และกลไกจุลภาคเชื่อมกันอย่างไร	อยู่นอกขอบเขตข้อสรุปของ P1

4 | ข้อมูลคืออะไร: RC และ GGL บอกอะไรเราแต่ละอย่าง

4.1 เส้นโค้งการหมุน (RC): มาตรวัดความเร็วของจานกาแล็กซี

เส้นโค้งการหมุนบันทึกว่าก๊าซและดาวฤกษ์โคจรรอบศูนย์กลางกาแล็กซีเร็วเพียงใดในรัศมีต่าง ๆ ยิ่งเคลื่อนที่เร็ว รัศมีนั้นก็ต้องการแรงสู่ศูนย์กลางมากขึ้น ซึ่งหมายถึงแรงโน้มถ่วงเชิงประสิทธิผลที่แรงขึ้น P1 ใช้ฐานข้อมูล SPARC หลังการเตรียมข้อมูลแล้วรวมกาแล็กซี 104 แห่ง จุดข้อมูลความเร็ว 2,295 จุด และแบ่งเป็น 20 RC-bin

4.2 เลนส์ความโน้มถ่วงอ่อน (GGL): ตาชั่งแรงโน้มถ่วงบนสเกลใหญ่กว่า

เลนส์ความโน้มถ่วงอ่อนระดับกาแล็กซี–กาแล็กซีวัดว่ากาแล็กซีฉากหน้าทำให้แสงจากกาแล็กซีพื้นหลังโค้งเล็กน้อยอย่างไร มันสอดคล้องกับการตอบสนองแรงโน้มถ่วงเชิงฉายบนสเกลที่ใหญ่กว่า คล้ายสเกลฮาโล และไม่ขึ้นกับรายละเอียดพลวัตของก๊าซในจานกาแล็กซี P1 ใช้ข้อมูล GGL สาธารณะจาก KiDS-1000 / Brouwer et al. 2021: 4 bin มวลดาว, bin ละ 15 จุดรัศมี รวม 60 จุดข้อมูล พร้อมเมทริกซ์โควาเรียนซ์เต็ม

4.3 การจับคู่แบบคงที่: ทำไม 20 RC-bin → 4 GGL-bin จึงสำคัญ

P1 เชื่อม 20 RC-bin กับ 4 GGL-bin ด้วยกฎคงที่: แต่ละ GGL-bin สอดคล้องกับ RC-bin จำนวนห้า bin และเฉลี่ยแบบถ่วงน้ำหนักด้วยจำนวนกาแล็กซี การจับคู่นี้คงเดิมสำหรับทุกแบบจำลอง จึงเป็นข้อจำกัดแข็งทั้งต่อการทดสอบการปิดวงและการเปรียบเทียบอย่างเป็นธรรม

ทำไมจึงปรับการจับคู่ย้อนหลังไม่ได้

ถ้าอนุญาตให้เลือกย้อนหลังว่า RC-bin ใดสอดคล้องกับ GGL-bin ใด แบบจำลองอาจผลิตการปิดวงขึ้นมาได้ด้วยการจัดเรียงความสอดคล้องใหม่ P1 จึงล็อกการจับคู่ 20→4 ไว้ล่วงหน้า แล้วจงใจทำลายด้วยตัวควบคุมเชิงลบแบบ shuffle เพื่อทดสอบว่าสัญญาณการปิดวงพึ่งพาความสอดคล้องที่สมเหตุสมผลทางฟิสิกส์จริงหรือไม่

5 | แบบจำลองและวิธีการ: P1 กำลังเปรียบเทียบอะไรจริง ๆ

5.1 ฝั่ง EFT: การตอบสนองแรงโน้มถ่วงเฉลี่ยมิติต่ำ

ฝั่ง EFT ใช้เทอมความเร็วส่วนเพิ่มมิติต่ำเพื่อบรรยายการตอบสนองแรงโน้มถ่วงเฉลี่ย รูปร่างของเทอมส่วนเพิ่มถูกควบคุมด้วยฟังก์ชันเคอร์เนลไร้มิติ f(r/ℓ) โดย ℓ เป็นสเกลสากล และแอมพลิจูดกำหนดตาม RC-bin เคอร์เนลต่างชนิดแทนความชันตั้งต้น ความเร็วในการเปลี่ยนผ่าน และหางระยะไกลที่ต่างกัน เพื่อใช้เป็นการทดสอบแรงกดดันด้านความทนทาน

5.2 ฝั่ง DM: ต้องอ่านการเปรียบเทียบหลักกับภาคผนวก P1A แยกกัน

ในการเปรียบเทียบหลัก DM_RAZOR เป็น baseline แบบ NFW ที่ย่อส่วนและตรวจสอบได้: ใช้ความสัมพันธ์ c–M คงที่ และไม่รวม halo-to-halo scatter, adiabatic contraction, feedback core, ความไม่เป็นทรงกลม หรือเทอมสิ่งแวดล้อม ข้อดีคืออิสระถูกควบคุมและทำซ้ำได้ง่าย ข้อจำกัดคือมันแทน LambdaCDM หรือแบบจำลองฮาโลสสารมืดทั้งหมดไม่ได้

ด้วยเหตุนี้ ภาคผนวก B (P1A) จึงเปลี่ยนฝั่ง DM ให้เป็นชุดการทดสอบแรงกดดันมาตรฐาน โดยไม่เปลี่ยนการจับคู่ร่วมและโปรโตคอลการปิดวง แล้วค่อย ๆ เพิ่มแขนงเสริมมิติต่ำ เช่น SCAT, AC, FB, HIER_CMSCAT, CORE1P, lensing m และ baseline รวม DM_STD พร้อมคง EFT_BIN ไว้เป็นตัวควบคุม อ่าน P1A ได้อย่างนี้: ไม่ได้เทียบกับ DM baseline ขั้นต่ำเพียงตัวเดียว แต่ยกกลไก DM ที่พบทั่วไปและตรวจสอบได้หลายแบบเข้ามาวัดด้วย “ไม้บรรทัดการปิดวง” อันเดียวกัน

ถ้อยคำข้อสรุปที่แม่นยำในเอกสารนี้

ข้อความหลัก: ชุด EFT ทำได้ดีกว่า DM_RAZOR ขั้นต่ำอย่างมีนัยสำคัญในการเปรียบเทียบหลัก

ภาคผนวก B / P1A: ภายใต้แขนงเสริม DM หลายแบบที่มิติต่ำและตรวจสอบได้ รวมถึงการทดสอบแรงกดดัน DM_STD การฟิตร่วมบางส่วนของ DM ดีขึ้น แต่ความแรงของการปิดวงไม่ได้ลบข้อได้เปรียบของ EFT_BIN

ดังนั้นถ้อยคำที่ปลอดภัยที่สุดคือ: ภายในข้อมูล การจับคู่ บัญชีพารามิเตอร์ และโปรโตคอลการปิดวงของ P1/P1A การตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT แสดงความสอดคล้องข้ามข้อมูลที่แข็งกว่า; สิ่งนี้ไม่เท่ากับการตัดแบบจำลองสสารมืดทั้งหมดออก

5.3 การทดสอบการปิดวง: ตรรกะการทดลองที่สำคัญที่สุดของ P1

1. ปรับแบบจำลองด้วย RC เท่านั้น เพื่อให้ได้ชุดตัวอย่าง posterior แบบ RC-only ชุดหนึ่ง

2. ไม่ปรับพารามิเตอร์ใหม่ด้วย GGL; ใช้ posterior จาก RC ไปทำนาย GGL โดยตรง

3. ใช้โควาเรียนซ์เต็มคำนวณคะแนนการทำนาย GGL ภายใต้การจับคู่ที่ถูกต้อง, logL_true

4. สุ่มสลับความสอดคล้อง RC-bin→GGL-bin แล้วคำนวณคะแนนตัวควบคุมเชิงลบ, logL_perm

5. นำสองค่านี้มาลบกันเพื่อได้ความแรงของการปิดวง: ΔlogL_closure = <logL_true> − <logL_perm>

อุปมาแบบง่าย

การทดสอบการปิดวงเหมือนการสอบซ้ำข้ามห้อง แบบจำลองเรียนรู้รูปแบบในห้องสอบ RC ก่อน แล้วไปตอบในห้องสอบ GGL หากมันเรียนรู้กฎร่วมจริง ไม่ใช่กลเม็ดเฉพาะที่ มันควรยังทำได้ดีเมื่อย้ายห้อง แต่ถ้าจงใจสับเปลี่ยนความสอดคล้องของห้องสอบ ข้อได้เปรียบก็ควรหายไป

5.4 ก่อนอ่านตารางเทคนิค: จับทางเข้า 4 จุดนี้ก่อน

ตาราง 5.4 | เส้นทางอ่านตารางเทคนิคแนวนอนชุดถัดไป

จุดเข้า	ดูอะไร	ทำไมจึงสำคัญ
ตาราง S1a	คะแนนรวมของการฟิตร่วม RC+GGL	ตอบว่า: เมื่อดูข้อมูลทั้งสองชุดพร้อมกัน คำอธิบายรวมของใครแข็งกว่า
ตาราง S1b	ความแรงของการปิดวง, shuffle, การสแกนความทนทาน	ตอบว่า: สิ่งที่ RC เรียนรู้ย้ายไป GGL ได้หรือไม่
ตาราง B0	นิยามแขนงเสริม DM หลายแบบใน P1A	ป้องกันไม่ให้ลดรูป P1 เหลือว่า “เทียบกับ DM_RAZOR ขั้นต่ำเท่านั้น”
ตาราง B1	ตารางคะแนนการปิดวงและการฟิตร่วมของ P1A	ตรวจว่าข้อได้เปรียบของการปิดวงหายไปหรือไม่หลังเสริม DM

หมายเหตุด้านรูปแบบ

หน้าถัดไปเปลี่ยนเป็นแนวนอนเพื่อรักษาตารางกว้างจากรายงานต้นฉบับไว้อย่างครบถ้วน โดยไม่ตัดคอลัมน์หรือบีบจนอ่านยาก เนื้อความหลักได้ให้วิธีอ่านสำหรับผู้อ่านทั่วไปไว้ก่อนแล้ว; ตารางเทคนิคแนวนอนมีไว้สำหรับผู้อ่านที่ต้องการตรวจตัวเลขและแขนงแบบจำลอง

รูป 0.1 | ภาพรวมเวิร์กโฟลว์การทดสอบการปิดวงของ P1

หมายเหตุ: โซ่ด้านบนคือ “การทดสอบการปิดวง” (ฟิตด้วย RC เท่านั้น → ใช้ posterior จาก RC ทำนาย GGL); โซ่ด้านล่างคือ “การฟิตร่วม” (ให้คะแนน RC+GGL พร้อมกัน) ด้านขวาเปรียบเทียบการจับคู่จริงกับการจับคู่ที่สับเปลี่ยน เพื่อได้ความแรงของการปิดวง ΔlogL

6 | ตารางเทคนิคสำคัญ: ตารางรายงานหลักและตาราง P1A

ตาราง S1a | ตัวชี้วัดการเปรียบเทียบหลักของการฟิตร่วม (RC+GGL, Strict; คงจากรายงานต้นฉบับ)

แบบจำลอง (workspace)	เคอร์เนล W	k	joint logL_total (best)	ΔlogL_total vs DM	AICc	BIC
DM_RAZOR	none	20	-16927.763	0.0	33895.885	34010.811
EFT_BIN	none	21	-15590.552	1337.21	31223.501	31344.155
EFT_WEXP	exponential	21	-15668.83	1258.932	31380.057	31500.711
EFT_WYUK	yukawa	21	-15772.936	1154.827	31588.268	31708.922
EFT_WPOW	powerlaw_tail	21	-15633.321	1294.442	31309.038	31429.692

ตาราง S1b | ตัวชี้วัดการปิดวงและความทนทาน (Strict; คงจากรายงานต้นฉบับ)

แบบจำลอง (workspace)	closure ΔlogL (true-perm)	ΔlogL หลัง shuffle ตัวควบคุมเชิงลบ	ช่วง ΔlogL ของการสแกน σ_int	ช่วง ΔlogL ของการสแกน R_min	ช่วง ΔlogL ของการสแกน cov-shrink
DM_RAZOR	126.678	22.725	—	—	—
EFT_BIN	231.611	14.984	459–1548	1243–1289	1337–1351
EFT_WEXP	171.977	6.04	408–1471	1169–1207	1259–1277
EFT_WYUK	179.808	14.688	380–1341	1065–1099	1155–1166
EFT_WPOW	280.513	6.672	457–1500	1203–1247	1294–1308

ตาราง B0 | นิยามแขนงเสริม DM ใน P1A (คงจากภาคผนวก B ของรายงานต้นฉบับ)

Workspace	โมเดล DM	พารามิเตอร์ใหม่ (≤1)	แรงจูงใจทางฟิสิกส์ (แกนหลัก)	หลักการทำงานจริง (เป็นมิตรต่อการตรวจสอบ)
DM_RAZOR	NFW (fixed c–M, no scatter)	—	baseline ฮาโล LambdaCDM ขั้นต่ำและตรวจสอบได้; ใช้เพื่อเปรียบเทียบอย่างเข้มงวดกับ EFT	การจับคู่ร่วมคงที่; บัญชีพารามิเตอร์เข้มงวด; ใช้เป็น baseline เพื่อการเปรียบเทียบสัมพัทธ์เท่านั้น
DM_RAZOR_SCAT	NFW + c–M scatter (legacy)	σ_logc	ยอมให้ความสัมพันธ์ c–M มี scatter; ประมาณด้วย log-normal scatter แบบพารามิเตอร์เดียว	≤1 พารามิเตอร์ใหม่; ยังใช้การจับคู่ร่วม; ใช้ closure gain เป็นเกณฑ์รับผ่าน
DM_RAZOR_AC	NFW + adiabatic contraction (legacy)	α_AC	การตกเข้าไปของแบริออนอาจขับการหดตัวเชิงอะเดียแบติกของฮาโล; ประมาณด้วยพารามิเตอร์ความแรงหนึ่งตัว	≤1 พารามิเตอร์ใหม่; ไม่เปลี่ยนการจับคู่; รายงานการเปลี่ยนแปลง AICc/BIC และ closure gain
DM_RAZOR_FB	NFW + feedback core (legacy)	log r_core	feedback อาจสร้าง core ด้านใน; ประมาณด้วยสเกล core แบบพารามิเตอร์เดียว	≤1 พารามิเตอร์ใหม่; โปรโตคอลการปิดวง/ตัวควบคุมเชิงลบใช้เกณฑ์เดียวกัน; ไม่ตั้งให้การปรับปรุง RC-only เป็นเป้าหมายเดียว
DM_HIER_CMSCAT	Hierarchical c–M scatter + prior	σ_logc (hier)	ลำดับชั้นที่มาตรฐานกว่า c_i∼logN(c(M_i), σ_logc); ส่งผลต่อ posterior ร่วมของ RC และ GGL	prior ระบุชัดเจน; latent c_i ถูก marginalize; ยังคงมิติต่ำและตรวจสอบได้
DM_CORE1P	1‑parameter core proxy (coreNFW/DC14‑inspired)	log r_core	ใช้ core proxy แบบพารามิเตอร์เดียวแทนผลหลักของ baryonic feedback เพื่อหลีกเลี่ยงรายละเอียดการก่อดาวมิติสูง	อ้างอิงวรรณกรรมมาตรฐาน; ≤1 พารามิเตอร์ใหม่; ผูกกับการทดสอบการปิดวง
DM_RAZOR_M	NFW + lensing shear‑calibration nuisance	m_shear (GGL)	ดูดกลืน systematic สำคัญฝั่งเลนส์อ่อนด้วยพารามิเตอร์เชิงประสิทธิผล เพื่อลดความเสี่ยงที่จะตี systematics เป็นฟิสิกส์	nuisance ถูกลงบัญชีอย่างชัดเจน; ไม่อนุญาตให้ย้อนกลับไปกระทบ RC; ตัดสินผลโดยเน้นความทนทานของการปิดวง
DM_STD	Standardized DM baseline (HIER_CMSCAT + CORE1P + m)	σ_logc + log r_core (+ m_shear)	นำข้อคัดค้านที่พบบ่อยที่สุดสามประเภทเข้า baseline มาตรฐานเดียวที่ยังคงมิติต่ำ	รายงานทั้งบัญชีพารามิเตอร์และเกณฑ์สารสนเทศ; การปิดวงเป็นตัวชี้วัดหลัก; ใช้เป็นตัวควบคุมป้องกันฝั่ง DM ที่แข็งที่สุด

ตาราง B1 | ตารางคะแนน P1A (ค่ายิ่งมากยิ่งดี; คงจากภาคผนวก B ของรายงานต้นฉบับ)

แขนงแบบจำลอง (workspace)	Δk	RC-only best logL_RC (Δ)	ความแรงของการปิดวง ΔlogL_closure (Δ)	Joint best logL_total (Δ)
DM_RAZOR	0	-15702.654 (+0.000)	122.205 (+0.000)	-27347.068 (+0.000)
DM_RAZOR_SCAT	1	-15702.294 (+0.361)	121.236 (-0.969)	-23153.311 (+4193.758)
DM_RAZOR_AC	1	-15703.689 (-1.035)	121.531 (-0.674)	-23982.557 (+3364.511)
DM_RAZOR_FB	1	-15496.046 (+206.609)	129.454 (+7.249)	-27478.531 (-131.463)
DM_HIER_CMSCAT	1	-15702.644 (+0.010)	121.978 (-0.227)	-23153.160 (+4193.908)
DM_CORE1P	1	-15723.158 (-20.504)	122.056 (-0.149)	-27336.258 (+10.810)
DM_RAZOR_M	0 (+m)	-15702.654 (+0.000)	122.205 (+0.000)	-27340.451 (+6.617)
DM_STD	2 (+m)	-15832.203 (-129.549)	105.690 (-16.515)	-22984.445 (+4362.623)
EFT_BIN	1	-14631.537 (+1071.117)	204.620 (+82.415)	-19001.142 (+8345.926)

วิธีอ่านตาราง B1 (ตารางคะแนน P1A)

• Δk: จำนวนองศาอิสระใหม่; ค่ายิ่งมากหมายถึงแบบจำลองซับซ้อนขึ้น ไม่ได้หมายความว่าดีขึ้นโดยอัตโนมัติ

• ให้ดูสองคอลัมน์เป็นหลัก: ความแรงของการปิดวง ΔlogL_closure(Δ) (ค่ายิ่งมากหมายถึงความสอดคล้องแบบย้ายข้ามสูงขึ้น) และ Joint best logL_total(Δ) (คะแนนรวมของการฟิตร่วม)

• ค่า (Δ) ในวงเล็บคือผลต่างเทียบกับ DM_RAZOR เพื่อให้เปรียบเทียบได้โดยตรง

• คำถามหลักของตารางนี้คือ เมื่อ DM baseline ถูก “เสริมอย่างสมเหตุสมผล” แล้ว ข้อได้เปรียบของการปิดวงจะหายไปหรือไม่

• เคล็ดลับการอ่าน: DM_STD ยกระดับคะแนนร่วมได้ชัดเจน แต่ความแรงของการปิดวงกลับลดลง; EFT_BIN ยังสูงกว่าในความแรงของการปิดวง

สรุปประโยคเดียว: ภายในชุดการเสริม DM ที่มิติต่ำและตรวจสอบได้นี้ การปรับปรุงการฟิตร่วมไม่ได้สร้างการปิดวงที่แข็งขึ้นโดยอัตโนมัติ; การปิดวง หรือความสามารถในการย้ายข้าม ยังเป็นเกณฑ์สำคัญ

7 | ควรอ่านผลหลักอย่างไร

7.1 การฟิตร่วม: เมื่อดูข้อมูลสองชุดพร้อมกัน EFT ได้คะแนนสูงกว่าในการเปรียบเทียบหลัก

ตาราง S1a และรูป S4 แสดงว่า ภายใต้ข้อมูลเดียวกัน การจับคู่ร่วมแบบเดียวกัน และขนาดพารามิเตอร์ใกล้เคียงกัน ชุด EFT มีค่า joint ΔlogL_total เทียบกับ DM_RAZOR อยู่ที่ 1155–1337 อ่านแบบง่ายคือ เมื่อใช้กฎให้คะแนนเดียวกันกับ RC และ GGL รวมกัน แบบจำลอง EFT ในการเปรียบเทียบหลักได้คะแนนรวมสูงกว่า

7.2 การทดสอบการปิดวง: สิ่งที่ P1 เน้นที่สุดคือ “การย้ายข้ามได้”

ความแรงของการปิดวงที่สูงหมายความว่า พารามิเตอร์ที่อนุมานจาก RC เท่านั้นสามารถทำนาย GGL ได้ดีกว่า โดยไม่กลับไปดู GGL ใหม่ ในรายงาน P1 ค่า ΔlogL_closure ของ EFT อยู่ที่ 172–281 ขณะที่ DM_RAZOR อยู่ที่ 127 ผลนี้สำคัญกว่าการพูดว่าแต่ละแบบจำลองฟิตข้อมูลของตัวเองได้ดี เพราะมันจำกัดอิสระของแบบจำลองบนชุดข้อมูลที่สอง

7.3 ตัวควบคุมเชิงลบ: ทำไม “สัญญาณยุบตัว” จึงเป็นเรื่องดี

เมื่อ P1 สุ่มสลับความสอดคล้องของกลุ่ม RC-bin→GGL-bin แล้ว สัญญาณการปิดวงของ EFT ลดลงมาอยู่ในช่วง 6–23 สำหรับผู้อ่านทั่วไป ขั้นตอนนี้คือการตรวจจับการโกง: ถ้าข้อได้เปรียบของการปิดวงเกิดจากโค้ด หน่วย การจัดการโควาเรียนซ์ หรือโชคจากการฟิตเท่านั้น การสับเปลี่ยนอาจยังให้ข้อได้เปรียบได้ แต่ผลจริงคือข้อได้เปรียบยุบตัว แสดงว่ามันพึ่งพาการจับคู่ที่ถูกต้อง

รูป S3 | ความแรงของการปิดวง (ค่ายิ่งมากยิ่งดี): ข้อได้เปรียบ log-likelihood เฉลี่ยสำหรับการทำนาย RC-only → GGL

วิธีอ่านรูปนี้

รูปนี้เป็นแกนกลางของ P1 แท่งยิ่งสูง ยิ่งหมายความว่าข้อมูลที่เรียนรู้จาก RC ย้ายไป GGL ได้ดีกว่า

ชุด EFT โดยรวมสูงกว่า DM_RAZOR แสดงถึงการปิดวงข้ามโพรบที่แข็งกว่าในการทดลอง “เรียน RC ก่อน แล้วทำนาย GGL”

รูป S4 | ข้อได้เปรียบการฟิตร่วม (ค่ายิ่งมากยิ่งดี): best logL_total ของ RC+GGL เทียบกับ DM_RAZOR

วิธีอ่านรูปนี้

รูปนี้แสดงคะแนนรวมหลังฟิต RC และ GGL ร่วมกัน

EFT ทุกตัวแปรอยู่สูงกว่า 0 อย่างชัดเจน แสดงว่าข้อได้เปรียบของ EFT ในการเปรียบเทียบหลักไม่ใช่ผลเฉพาะจุดเดียว แต่เป็นพฤติกรรมรวมของการวิเคราะห์ร่วม

รูป R1 | ตัวควบคุมเชิงลบ: สัญญาณการปิดวงลดลงชัดเจนหลังสับเปลี่ยนการจัดกลุ่ม

วิธีอ่านรูปนี้

รูปนี้แสดงว่า เมื่อสับเปลี่ยนความสัมพันธ์การแบ่ง bin RC↔GGL ที่ถูกต้อง สัญญาณการปิดวงจะลดลงอย่างรวดเร็ว

สิ่งนี้ทำให้ผล P1 ดูเหมือนความสอดคล้องจริงใน mapping ข้ามข้อมูล มากกว่าจะเป็นความบังเอิญเชิงตัวเลขที่ได้จาก mapping แบบใดก็ได้

8 | ความทนทานและตัวควบคุม: P1 หลีกเลี่ยงไม่ให้ดูเหมือนแค่ปรับพารามิเตอร์อย่างไร

คำถามธรรมชาติสำหรับรายงานเทคนิคคือ ข้อได้เปรียบมาจากการตั้งค่า noise หนึ่งแบบ ช่วงข้อมูลส่วนกลางหนึ่งช่วง การจัดการโควาเรียนซ์แบบหนึ่ง หรือการ overfit หรือไม่ P1 ตอบด้วยการทดสอบแรงกดดันหลายชุด

ตาราง 2 | วิธีอ่านการทดสอบความทนทานและตัวควบคุมเชิงลบของ P1

การทดสอบ	คำถามที่ต้องการตัดออก	วิธีอ่าน
การสแกน σ_int	หากใน RC มี scatter ไม่ทราบที่มาเพิ่มเติม ข้อสรุปยังเสถียรหรือไม่	หลังผ่อนความคลาดเคลื่อนของ RC อันดับและสเกลข้อได้เปรียบของ EFT ยังเสถียร
การสแกน R_min	หากไม่ไว้วางใจบริเวณกลางกาแล็กซีอย่างเต็มที่ ข้อสรุปยังเสถียรหรือไม่	หลังตัดบริเวณศูนย์กลางออก EFT ยังรักษาข้อได้เปรียบเชิงบวกไว้
การสแกน cov-shrink	หากการประมาณโควาเรียนซ์ของ GGL ยังไม่แน่นอน ข้อสรุปยังเสถียรหรือไม่	หลังหดโควาเรียนซ์เข้าหาเมทริกซ์ทแยง ข้อได้เปรียบไม่ไวต่อการเปลี่ยนแปลง
ขั้นบันได ablation	EFT ได้เปรียบเพราะความซับซ้อนที่ไม่จำเป็นหรือไม่	EFT_BIN แบบเต็มมีความจำเป็นภายใต้เกณฑ์สารสนเทศ
การทำนายแบบ LOO เมื่อกันข้อมูลไว้	แบบจำลองอธิบายได้เฉพาะข้อมูลที่เคยเห็นหรือไม่	GGL bin ที่กันไว้ยังแสดงการ generalize ที่ค่อนข้างแข็ง
RC-bin shuffle	การปิดวงมาจาก mapping จริงหรือไม่	การปิดวงลดลงหลังสับเปลี่ยนกลุ่ม สนับสนุนว่ามันพึ่งพา mapping

รูป R2 | ช่วงของ ΔlogL_total ภายใต้การสแกน σ_int (ค่ายิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ตรวจว่าข้อได้เปรียบของ EFT ยังอยู่หรือไม่หลังเปลี่ยนสมมติฐาน scatter ภายในของ RC

รูป R3 | ช่วงของ ΔlogL_total ภายใต้การสแกน R_min (ค่ายิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ตรวจว่าข้อได้เปรียบของ EFT ยังเสถียรหรือไม่หลังตัดบริเวณศูนย์กลางที่ซับซ้อนออก

รูป R4 | ช่วงของ ΔlogL_total ภายใต้การสแกน cov-shrink (ค่ายิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

ตรวจว่าอันดับไวต่อการเปลี่ยนแปลงการจัดการโควาเรียนซ์ของเลนส์อ่อนหรือไม่

รูป R5 | ขั้นบันได ablation ของ EFT_BIN (AICc; ค่ายิ่งน้อยยิ่งดี)

วิธีอ่านรูปนี้

ตรวจว่า EFT_BIN แบบเต็มจำเป็นต่อการอธิบายข้อมูลจริงหรือไม่ ไม่ใช่แค่เพิ่มพารามิเตอร์เปล่า ๆ

รูป R6 | LOO: การกระจาย log-likelihood ของ bin ที่กันไว้

วิธีอ่านรูปนี้

ตรวจว่าแบบจำลองยังทำนาย GGL bin ที่ไม่เคยเห็นได้หรือไม่

รูป R7 | ตัวควบคุมเชิงลบ: การจับคู่แบบ shuffle ทำให้ mean logL_true ของการปิดวงลดลงอย่างชัดเจน

วิธีอ่านรูปนี้

แสดงเพิ่มเติมจากมุมมอง mean logL_true ว่าการปิดวงพึ่งพาการจับคู่ข้ามข้อมูลที่ถูกต้อง

9 | P1A: ทำไม “มีแบบจำลอง DM หลายแบบในภาคผนวก” จึงเป็นการแก้ไขสำคัญ

ส่วนนี้ไม่ได้ถามว่า “EFT ชนะเพียง DM_RAZOR ขั้นต่ำตัวเดียวหรือไม่” แต่ถามว่า เมื่อเราเสริม DM baseline ภายในกรอบมิติต่ำ ทำซ้ำได้ และมีบัญชีพารามิเตอร์ชัดเจน (P1A) ข้อสรุปของการทดสอบการปิดวงและการฟิตร่วมจะเปลี่ยนไปหรือไม่ กล่าวอีกอย่าง P1A ลดข้อวิจารณ์ว่าเลือก DM baseline อ่อนเกินไป และพาการสนทนาไปสู่คำถามว่า ภายใต้ชุด DM ที่เสริมแล้วแต่ยังตรวจสอบได้ ผลงานด้านการปิดวงยังต่างกันอยู่หรือไม่

P1A ไม่ได้พยายามครอบคลุมความเป็นไปได้ทั้งหมดของการสร้างแบบจำลองฮาโลแบบ LambdaCDM และไม่ได้เปลี่ยนฝั่ง DM ให้เป็นตัวฟิตมิติสูงที่ตรวจสอบไม่ได้ มันเลือกการเสริมที่มิติต่ำ ทำซ้ำได้ และมีบัญชีพารามิเตอร์ชัดเจน ได้แก่ concentration scatter, adiabatic contraction, feedback core, hierarchical c–M scatter prior, ตัวแทน core แบบพารามิเตอร์เดียว, weak-lensing shear-calibration nuisance และแขนงรวม DM_STD

วิธีอ่านหลักของ P1A

ในสามแขนง legacy มีเพียง feedback/core ที่ให้ net gain เล็กน้อยต่อความแรงของการปิดวง; SCAT และ AC ไม่ให้ net closure gain

DM_HIER_CMSCAT, DM_RAZOR_M และ DM_CORE1P มีผลต่อความแรงของการปิดวงน้อยมาก หรือไม่แสดง net gain ที่มีนัยสำคัญ

DM_STD สามารถปรับปรุง joint logL ได้อย่างมาก แต่ความแรงของการปิดวงลดลง ชี้ว่ามันเพิ่มความยืดหยุ่นของการฟิตร่วมเป็นหลัก ไม่ใช่พลังทำนายแบบย้ายข้าม RC→GGL

ในตาราง B1 ของ P1A, EFT_BIN ยังรักษาความแรงของการปิดวงและข้อได้เปรียบการฟิตร่วมที่สูงกว่าไว้ ดังนั้นข้ออ้างแกนกลางของ P1 ไม่ควรถูกลดรูปเป็น “ชนะเฉพาะ DM_RAZOR ขั้นต่ำ”

รูป B1 | ตารางคะแนน P1A: closure และ joint ΔlogL เทียบกับ baseline (ค่ายิ่งมากยิ่งดี)

วิธีอ่านรูปนี้

รูปนี้แสดงผลงานของแขนงเสริม DM หลายแบบเทียบกับ baseline

ความหมายของมันไม่ใช่ “ตัด DM ทั้งหมดออก” แต่แสดงว่า ภายในชุดการเสริม DM แบบมิติต่ำและตรวจสอบได้ที่ P1A เลือกไว้ การทำให้ DM แข็งขึ้นไม่ได้ลบข้อได้เปรียบด้านการปิดวงของ EFT_BIN

10 | ความหมายของการทดลอง P1: ทำไมเรื่องนี้จึงควรทำ

10.1 ความหมายเชิงวิธีวิทยา: ยกการปิดวงข้ามโพรบให้อยู่เหนือการฟิตโพรบเดี่ยว

ทฤษฎีระดับกาแล็กซีมักติดอยู่กับคำถามว่าแบบจำลองใดฟิตเส้นโค้งการหมุนชุดหนึ่งได้หรือไม่ P1 ยกระดับเกณฑ์ขึ้น: พารามิเตอร์ที่เรียนรู้จาก RC จะทำนายเลนส์อ่อนโดยไม่ปรับใหม่กับ GGL ได้หรือไม่ สิ่งนี้เปลี่ยน P1 จากการแข่งขันฟิตข้อมูลเป็นการทดสอบการทำนายแบบย้ายข้าม

10.2 ความหมายด้านความโปร่งใส: ถือห่วงโซ่การทำซ้ำได้ว่าเป็นส่วนหนึ่งของผลลัพธ์

ผลงานสำคัญอย่างหนึ่งของ P1 คือการเผยแพร่ข้อมูล ตารางและรูปภาพ run labels ตัวควบคุมเชิงลบ แพ็กเกจทำซ้ำ และห่วงโซ่ตรวจสอบไปพร้อมกัน สิ่งนี้สำคัญทั้งต่อผู้สนับสนุนและผู้วิจารณ์ เพราะการอภิปรายสามารถกลับไปยังข้อมูลสาธารณะชุดเดียวกัน การจับคู่ชุดเดียวกัน สคริปต์ชุดเดียวกัน และตัวชี้วัดชุดเดียวกัน แทนที่จะเปรียบเทียบแค่คำขวัญ

10.3 ความหมายทางฟิสิกส์: การทดสอบแรงกดดันที่หนักสำหรับแนวทางแรงโน้มถ่วงที่ไม่พึ่งสสารมืด

ในแนวทางแรงโน้มถ่วงที่ไม่พึ่งสสารมืด แบบจำลองจำนวนมากอธิบายปรากฏการณ์ของเส้นโค้งการหมุนหรือ RAR ได้บางส่วน งานที่ยากกว่าคือการผ่านค่าที่อ่านจากเลนส์อ่อนไปพร้อมกัน และแสดงด้วยตัวควบคุมเชิงลบว่าสัญญาณพึ่งพาการจับคู่ที่ถูกต้อง ความหมายของ P1 คือมันนำการตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT เข้าไปอยู่ในโปรโตคอลคล้ายการสอบภายนอก: RC เป็นสนามฝึก, GGL เป็นสนามย้ายข้าม, และ shuffle เป็นสนามตรวจจับการโกง

10.4 นี่เป็นการทดลองสำคัญสำหรับสาขาแรงโน้มถ่วงที่ไม่พึ่งสสารมืดหรือไม่

คำตอบอย่างระมัดระวังคือ หากการจัดการข้อมูล แพ็กเกจทำซ้ำ และโปรโตคอลการปิดวงของ P1 ยืนอยู่ได้ภายใต้การทบทวนจากภายนอก มันสามารถถูกมองเป็นการทดลองการปิดวง RC+GGL ที่ควรรับฟังอย่างจริงจังในงานวิจัยแรงโน้มถ่วงที่ไม่พึ่งสสารมืด / modified gravity ความสำคัญของมันไม่ได้อยู่ที่ประโยคว่า “ล้มล้างสสารมืด” แต่อยู่ที่การเสนอเกณฑ์ข้ามโพรบที่ทำซ้ำได้ ท้าทายได้ และขยายต่อได้

มีกรอบการปิดวงเชิงทำนาย RC+GGL ที่แข็งเท่ากันอยู่แล้วหรือไม่

มีกรอบที่เกี่ยวข้องและประเพณีการสังเกตอยู่แล้ว MOND/RAR จัดระเบียบปรากฏการณ์เส้นโค้งการหมุนจำนวนมากได้ดี งาน KiDS-1000 weak-lensing RAR ก็เปรียบเทียบ MOND, Verlinde emergent gravity และ LambdaCDM ส่วน LambdaCDM เองก็อธิบายปรากฏการณ์เลนส์อ่อน/พลวัตบางส่วนได้ผ่าน galaxy–halo connections, gas halos และ feedback modeling

แต่ข้ออ้างที่แม่นยำของ P1 ไม่ใช่ว่าไม่มีกรอบอื่นใดในโลกอธิบาย RC+GGL ได้ หากแต่คือ ภายใต้การจับคู่คงที่สาธารณะของ P1, การปิดวง RC-only→GGL, ตัวควบคุมเชิงลบแบบ shuffle, บัญชีพารามิเตอร์ และโปรโตคอลทดสอบแรงกดดันหลาย DM ของ P1A นั้น EFT รายงานผลงานการปิดวงที่แข็งกว่า

กล่าวอีกอย่าง สิ่งที่ควรถูกทดสอบจากภายนอกมากที่สุดใน P1 คือโปรโตคอลเปรียบเทียบที่เป็นรูปธรรมและทำซ้ำได้ ก้าวถัดไปที่มีคุณค่ามากคือทดสอบว่า MOND/RAR, LambdaCDM/HOD, hydrodynamical simulations หรือกรอบ modified gravity อื่น ๆ จะทำคะแนนการปิดวงเท่ากันหรือสูงกว่าได้หรือไม่ภายใต้โปรโตคอลเดียวกัน

11 | P1 สรุปอะไรได้ และสรุปอะไรไม่ได้

ตาราง 3 | ขอบเขตข้อสรุปของ P1

สรุปได้	ภายใต้ข้อมูล RC+GGL การจับคู่คงที่ และโปรโตคอลเปรียบเทียบหลักของ P1 ชุด EFT มีความแรงด้านการฟิตร่วมและการปิดวงสูงกว่า DM_RAZOR ขั้นต่ำ
สรุปได้	ภายในช่วงการเสริม DM ของ P1A ที่มิติต่ำและตรวจสอบได้ การเสริม DM หลายแบบไม่ได้ลบข้อได้เปรียบการปิดวงของ EFT_BIN
สรุปได้	ตัวควบคุมเชิงลบแบบ shuffle แสดงว่าสัญญาณการปิดวงพึ่งพาการจับคู่ข้ามข้อมูลที่ถูกต้อง และไม่ได้มาจาก mapping แบบใดก็ได้
สรุปไม่ได้	P1 ไม่ได้ล้มล้างแบบจำลองสสารมืดทั้งหมด P1A ยังไม่ครอบคลุมความไม่เป็นทรงกลม การพึ่งพาสิ่งแวดล้อม galaxy–halo connections ที่ซับซ้อน feedback มิติสูง หรือการจำลองจักรวาลวิทยาเต็มรูปแบบ
สรุปไม่ได้	P1 ไม่ได้พิสูจน์ทฤษฎี EFT เต็มจาก first principles มันทดสอบเพียงชั้นปรากฏการณ์วิทยาของการตอบสนองแรงโน้มถ่วงเฉลี่ย
สรุปไม่ได้	P1 ไม่ได้ตัด systematics ทั้งหมดออก มันให้หลักฐานความทนทานเฉพาะภายในชุดการทดสอบแรงกดดันและขอบเขตตรวจสอบที่ระบุไว้

12 | คำถามที่พบบ่อยสำหรับผู้อ่านทั่วไป

Q1: นี่หมายความว่า “สสารมืดไม่มีอยู่จริง” หรือไม่

ไม่ใช่ ข้อสรุปของ P1 ต้องจำกัดอยู่ในข้อมูล โปรโตคอล และแบบจำลองเปรียบเทียบที่ใช้ในที่นี้ P1A ก้าวเลย DM_RAZOR ขั้นต่ำไปแล้ว แต่ยังไม่แทนแบบจำลองสสารมืดที่เป็นไปได้ทั้งหมด

Q2: นี่หมายความว่า “EFT ได้รับการพิสูจน์แล้ว” หรือไม่

ก็ไม่ใช่เช่นกัน P1 ทดสอบ EFT ในฐานะพารามิเตอร์ไรเซชันของการตอบสนองแรงโน้มถ่วงเฉลี่ย และแสดงสมรรถนะการปิดวง RC→GGL ที่แข็งกว่า กลไกจุลภาคและทฤษฎีเต็มไม่ใช่ข้อสรุปของ P1

Q3: ทำไมไม่รายงานค่านัยสำคัญ σ โดยตรง

P1 ใช้คะแนน likelihood แบบรวม เกณฑ์สารสนเทศ และค่าต่างการปิดวง ΔlogL คือข้อได้เปรียบสัมพัทธ์ภายใต้กฎให้คะแนนเดียวกัน ไม่เท่ากับค่า σ ค่าเดียว

Q4: ทำไมต้องสับเปลี่ยนการจับคู่ RC-bin→GGL-bin

นี่คือตัวควบคุมเชิงลบ สัญญาณข้ามโพรบที่แท้จริงควรพึ่งพาการจับคู่ที่ถูกต้อง หากสับเปลี่ยนแล้วยังแรงเท่าเดิม นั่นกลับจะชี้ว่ามี bias จากการทำงานจริงหรือสิ่งประดิษฐ์ทางสถิติ

Q5: ก้าวต่อไปที่ P1 ควรทำมากที่สุดคืออะไร

ขยายโปรโตคอลเดียวกันไปสู่ข้อมูลที่มากขึ้น ตัวควบคุม DM ที่มากขึ้น systematics ที่ซับซ้อนขึ้น และกรอบ modified gravity ที่หลากหลายขึ้น โดยเฉพาะในรูปแบบที่ให้ทีมภายนอกทดสอบซ้ำได้ภายใต้ตัวชี้วัดการปิดวงเดียวกัน

13 | ศัพท์ย่อและคำสำคัญ

ตาราง 4 | ศัพท์ย่อและคำสำคัญ

คำศัพท์	คำอธิบายหนึ่งประโยค
เส้นโค้งการหมุน (RC)	ความสัมพันธ์รัศมี–ความเร็วในจานกาแล็กซี ใช้อนุมานแรงโน้มถ่วงเชิงประสิทธิผลภายในระนาบจาน
เลนส์ความโน้มถ่วงอ่อน (GGL)	วัดการกระจายเฉลี่ยของแรงโน้มถ่วง/มวลรอบกาแล็กซีฉากหน้า ผ่านการบิดเบี้ยวเชิงสถิติของรูปร่างกาแล็กซีพื้นหลัง
การทดสอบการปิดวง	ใช้ posterior จาก RC ทำนาย GGL แล้วเปรียบเทียบกับตัวควบคุมเชิงลบจาก mapping ที่สับเปลี่ยน
ตัวควบคุมเชิงลบ	จงใจทำลายโครงสร้างสำคัญเพื่อดูว่าสัญญาณหายไปหรือไม่ ใช้ตัดสัญญาณปลอม
ฮาโล NFW	โปรไฟล์ความหนาแน่นของฮาโลสสารมืดที่ใช้กันทั่วไปในแบบจำลองสสารมืดเย็น
ความสัมพันธ์ c–M	ความสัมพันธ์ระหว่างความเข้มข้นของฮาโล c กับมวล M; การยอมให้มี scatter ส่งผลต่อความยืดหยุ่นของแบบจำลอง
DM_STD	แขนงการทดสอบแรงกดดัน DM มาตรฐานใน P1A ที่รวมการเสริม DM มิติต่ำหลายแบบเข้ากับพารามิเตอร์ nuisance ของเลนส์
ΔlogL	ผลต่าง log-likelihood ระหว่างแบบจำลองสองแบบภายใต้กฎให้คะแนนเดียวกัน; ค่าบวกหมายถึงแบบแรกทำได้ดีกว่า
โควาเรียนซ์	คำอธิบายแบบเมทริกซ์ของความสัมพันธ์ระหว่างจุดข้อมูล; ข้อมูลเลนส์อ่อนมักต้องใช้เมทริกซ์โควาเรียนซ์เต็ม

14 | เส้นทางอ่านที่แนะนำและจุดเข้าอ้างอิง

1. อ่านส่วน 0–2 ก่อน เพื่อจับคำถามของ P1 และบทบาทที่จำกัดของ EFT ภายใน P1

2. จากนั้นอ่านรูป S3, รูป S4 และตาราง S1a/S1b เพื่อเข้าใจความแรงของการปิดวง การฟิตร่วม และตัวควบคุมเชิงลบ

3. หากกังวลว่า DM baseline อ่อนเกินไป ให้ไปที่ส่วน 9 และตาราง B1 / รูป B1 โดยตรง

4. หากต้องการตรวจสอบเชิงเทคนิค ให้กลับไปยังรายงานเทคนิค P1 v1.1, Tables & Figures Supplement และ full_fit_runpack

จุดเข้าเอกสารเก็บถาวรหลัก

รายงานเทคนิค P1 (ระดับเผยแพร่, Concept DOI): 10.5281/zenodo.18526334

แพ็กเกจทำซ้ำ P1 แบบเต็ม (Concept DOI): 10.5281/zenodo.18526286

ฐานความรู้ EFT แบบมีโครงสร้าง (ไม่บังคับ, Concept DOI): 10.5281/zenodo.18853200

หมายเหตุใบอนุญาต: รายงานเทคนิคใช้ CC BY-NC-ND 4.0; แพ็กเกจทำซ้ำเต็มใช้ CC BY 4.0 (ยึดตามรายงานเทคนิคและระเบียน Zenodo archive)

15 | เอกสารอ้างอิงและภูมิหลังภายนอก

McGaugh, S. S., Lelli, F., & Schombert, J. M. (2016). The Radial Acceleration Relation in Rotationally Supported Galaxies. Physical Review Letters, 117, 201101. DOI: 10.1103/PhysRevLett.117.201101.

Famaey, B., & McGaugh, S. S. (2012). Modified Newtonian Dynamics (MOND): Observational Phenomenology and Relativistic Extensions. Living Reviews in Relativity, 15, 10. DOI: 10.12942/lrr-2012-10.

Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.

Mistele, T., McGaugh, S., Lelli, F., Schombert, J., & Li, P. (2024). Indefinitely Flat Circular Velocities and the Baryonic Tully-Fisher Relation from Weak Lensing. The Astrophysical Journal Letters, 969, L3 / arXiv:2406.09685.

Bullock, J. S., & Boylan-Kolchin, M. (2017). Small-Scale Challenges to the LambdaCDM Paradigm. Annual Review of Astronomy and Astrophysics, 55, 343–387. DOI: 10.1146/annurev-astro-091916-055313.

Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.

Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493.

Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374.

0 | เข้าใจ P1 ใน 5 นาที: การทดสอบนี้กำลังทำอะไรอยู่

1 | ทำไมต้องทำ P1: จักรวาลวิทยาระดับกาแล็กซีติดขัดตรงไหน

2 | EFT ใน P1 หมายถึงอะไร: ไม่ใช่ทฤษฎีสนามเชิงประสิทธิผล

3 | แผนชุด P1: ทำไมต้องเริ่มจาก “ฐานเฉลี่ย”

4 | ข้อมูลคืออะไร: RC และ GGL บอกอะไรเราแต่ละอย่าง

4.1 เส้นโค้งการหมุน (RC): มาตรวัดความเร็วของจานกาแล็กซี

4.2 เลนส์ความโน้มถ่วงอ่อน (GGL): ตาชั่งแรงโน้มถ่วงบนสเกลใหญ่กว่า

4.3 การจับคู่แบบคงที่: ทำไม 20 RC-bin → 4 GGL-bin จึงสำคัญ

5 | แบบจำลองและวิธีการ: P1 กำลังเปรียบเทียบอะไรจริง ๆ

5.1 ฝั่ง EFT: การตอบสนองแรงโน้มถ่วงเฉลี่ยมิติต่ำ

5.2 ฝั่ง DM: ต้องอ่านการเปรียบเทียบหลักกับภาคผนวก P1A แยกกัน

5.3 การทดสอบการปิดวง: ตรรกะการทดลองที่สำคัญที่สุดของ P1

5.4 ก่อนอ่านตารางเทคนิค: จับทางเข้า 4 จุดนี้ก่อน

6 | ตารางเทคนิคสำคัญ: ตารางรายงานหลักและตาราง P1A

122.205 (+0.000)

121.236 (-0.969)

121.531 (-0.674)

129.454 (+7.249)

121.978 (-0.227)

122.056 (-0.149)

122.205 (+0.000)

105.690 (-16.515)

204.620 (+82.415)

7 | ควรอ่านผลหลักอย่างไร

7.1 การฟิตร่วม: เมื่อดูข้อมูลสองชุดพร้อมกัน EFT ได้คะแนนสูงกว่าในการเปรียบเทียบหลัก

7.2 การทดสอบการปิดวง: สิ่งที่ P1 เน้นที่สุดคือ “การย้ายข้ามได้”

7.3 ตัวควบคุมเชิงลบ: ทำไม “สัญญาณยุบตัว” จึงเป็นเรื่องดี

8 | ความทนทานและตัวควบคุม: P1 หลีกเลี่ยงไม่ให้ดูเหมือนแค่ปรับพารามิเตอร์อย่างไร

9 | P1A: ทำไม “มีแบบจำลอง DM หลายแบบในภาคผนวก” จึงเป็นการแก้ไขสำคัญ

10 | ความหมายของการทดลอง P1: ทำไมเรื่องนี้จึงควรทำ

10.1 ความหมายเชิงวิธีวิทยา: ยกการปิดวงข้ามโพรบให้อยู่เหนือการฟิตโพรบเดี่ยว

10.2 ความหมายด้านความโปร่งใส: ถือห่วงโซ่การทำซ้ำได้ว่าเป็นส่วนหนึ่งของผลลัพธ์

10.3 ความหมายทางฟิสิกส์: การทดสอบแรงกดดันที่หนักสำหรับแนวทางแรงโน้มถ่วงที่ไม่พึ่งสสารมืด

10.4 นี่เป็นการทดลองสำคัญสำหรับสาขาแรงโน้มถ่วงที่ไม่พึ่งสสารมืดหรือไม่

11 | P1 สรุปอะไรได้ และสรุปอะไรไม่ได้

12 | คำถามที่พบบ่อยสำหรับผู้อ่านทั่วไป

13 | ศัพท์ย่อและคำสำคัญ

14 | เส้นทางอ่านที่แนะนำและจุดเข้าอ้างอิง

15 | เอกสารอ้างอิงและภูมิหลังภายนอก