P1_RC_GGL: การทดสอบปิดวงจรอย่างเข้มงวดของพลวัตดาราจักรและเลนส์ความโน้มถ่วงอ่อน (เส้นโค้งการหมุน + GGL)
กรอบแรงโน้มถ่วงเฉลี่ยของ EFT เทียบกับเส้นฐาน NFW ขั้นต่ำสำหรับสสารมืดเย็น (DM)
อ่านรายงานการประเมินฉบับต้นฉบับ:
1. ChatGPT: https://chatgpt.com/share/6a00cd62-6e34-83eb-b165-6ec09e3519cc
2. Gemini: https://gemini.google.com/share/773ec96d75a0
3. Grok: https://grok.com/share/bGVnYWN5LWNvcHk_c0b4fa65-0e86-4adb-9b58-5617d616dc04
4. Qwen: https://chat.qwen.ai/s/22ab9336-671f-420a-a7fa-43e24774bb2a?fev=0.2.46
5. DeepSeek: https://chat.deepseek.com/share/tj6k7hb5owtoldg2bm
0 บทสรุปสำหรับผู้บริหาร
รายงานฉบับนี้เป็นฉบับเก็บถาวรระดับเผยแพร่ที่ฝากไว้บน Zenodo โดยให้ห่วงโซ่ที่ตรวจสอบได้แบบบูรณาการ ครอบคลุมข้อมูล บัญชีแบบจำลอง การเปรียบเทียบอย่างเป็นธรรม การทดสอบปิดวงจร และวัสดุสำหรับการทำซ้ำผล ภาคผนวก B (P1A) ทำหน้าที่เป็นส่วนเสริมด้านความทนทาน โดยมุ่งเน้นการทดสอบแรงกดดันด้วย “เส้นฐาน DM ที่เป็นมาตรฐานมากขึ้น + ระบบผิดพลาดด้านเลนส์ที่สำคัญหนึ่งรายการ” เพื่อประเมินความไวของข้อสรุปหลักต่อการสร้างแบบจำลอง DM ที่สมจริงยิ่งขึ้นและการจัดการระบบผิดพลาดของเลนส์
ข้อสรุปหลัก (สี่ประโยคที่อ้างอิงได้โดยตรง; ดูหัวข้อ 2.4):
(1) ในการฟิตเส้นโค้งการหมุน (RC) ตระกูลแบบจำลอง EFT เหนือกว่า DM_RAZOR อย่างมีนัยสำคัญภายใต้ชุดเคอร์เนล/ไพรเออร์ทุกแบบ; ค่าปรับปรุงโดยทั่วไปคือ Δlog𝓛_RC ≈ 10^3 (ดูตาราง S1a)
(2) ในการทดสอบปิดวงจร RC→GGL, EFT แสดงความสามารถในการถ่ายโอนข้ามโพรบที่แข็งแรงกว่า: ความแรงของการปิดวงจร Δlog𝓛_closure (True−Perm) สูงกว่า DM_RAZOR อย่างมีนัยสำคัญ และความแตกต่างนี้ทนทานต่อการสแกน covariance shrinkage, R_min และ σ_int (ดูรูป S3 และตาราง S1b)
(3) ในการฟิตร่วม (RC+GGL), EFT ยังรักษาความได้เปรียบอย่างเสถียร; เมื่อใช้ตัวควบคุมเชิงลบที่ทำลายการจับคู่ร่วม ความได้เปรียบนี้ยุบตัวลง สนับสนุนการตีความว่า “ผลแรงโน้มถ่วงเฉลี่ย” มาจากการจับคู่ร่วม ไม่ใช่การฟิตโดยบังเอิญ (ดูรูป S4)
(4) ภาคผนวก B (P1A) ทดสอบแรงกดดันด้าน DM ด้วยโมดูลเส้นฐาน DM ที่เป็นมาตรฐานมากขึ้นและ nuisance ของระบบเลนส์ที่สำคัญหนึ่งรายการ โดยไม่เพิ่มมิติอย่างมีนัยสำคัญ การเสริมเหล่านี้ไม่ได้ลบความได้เปรียบด้านการปิดวงจรของ EFT (ดูตาราง B1 และรูป B1)
ความพร้อมของข้อมูลและโค้ด: รายงาน Concept DOI 10.5281/zenodo.18526334; แพ็กเกจทำซ้ำผลฉบับเต็ม Concept DOI 10.5281/zenodo.18526286 แท็กที่สอดคล้องกับภาคผนวก B (P1A) คือ run_tag=20260213_151233, closure_tag=20260213_161731 และ joint_tag=20260213_195428
1 บทคัดย่อ
เราดำเนินการเปรียบเทียบเชิงปริมาณที่ทำซ้ำได้ระหว่างกรอบทฤษฎีสองชุด ภายใต้ข้อมูลเดียวกันและโปรโตคอลสถิติเดียวกัน ได้แก่ แบบจำลอง “การแก้ไขแรงโน้มถ่วงเฉลี่ย” ที่เสนอโดยทฤษฎีเส้นใยพลังงาน (Energy Filament Theory, EFT; แตกต่างจากคำย่อทั่วไปของ effective field theory) และแบบจำลองเส้นฐานฮาโล NFW ของสสารมืดเย็น (DM_RAZOR) ทั้งนี้ DM_RAZOR ถูกเลือกโดยเจตนาให้เป็น “เส้นฐาน DM ขั้นต่ำ”: ฮาโล NFW ที่มีความสัมพันธ์ c–M คงที่ (ไม่มี halo-to-halo scatter) เพื่อทำหน้าที่เป็นตัวควบคุมที่ตรวจสอบและทำซ้ำได้ ควรเน้นด้วยว่าบทความนี้ปฏิบัติต่อ EFT ในฐานะพารามิเตอร์ไรเซชันเชิงปรากฏการณ์แบบ MOND-like ของสนามมีผล/การตอบสนองมีผล สำหรับการทดสอบภายใต้โปรโตคอลสถิติแบบรวม ไม่ใช่การอนุมานหลักการจุลภาคลำดับแรกภายในงานนี้
ข้อมูลประกอบด้วยจุดข้อมูลความเร็ว 2,295 จุดจากเส้นโค้งการหมุน SPARC (RC) ซึ่งผ่านการเตรียมข้อมูลและแบ่ง bin อย่างเป็นระบบ (104 ดาราจักร, 20 RC bins) ร่วมกับความหนาแน่นผิวส่วนเกิน ΔΣ(R) จากเลนส์ความโน้มถ่วงอ่อนระหว่างดาราจักร KiDS-1000 (GGL) (4 bin มวลดาว × 15 จุด R ต่อ bin รวม 60 จุด โดยใช้ covariance เต็มรูปแบบ)
เราดำเนินการตามลำดับ ได้แก่ การอนุมานแบบ RC-only, การทดสอบปิดวงจร RC→GGL, การอนุมานแบบ GGL-only และการอนุมานร่วม RC+GGL พร้อมใช้การตรวจสอบความสอดคล้องเพื่อให้แน่ใจว่าค่าตัวเลขทุกค่าที่อ้างถึงสามารถสืบย้อนกลับได้ ภายใต้บัญชีพารามิเตอร์ที่เข้มงวดและข้อจำกัดการจับคู่ร่วม (DM: พารามิเตอร์ log M200_bin จำนวน 20 ตัว; EFT: พารามิเตอร์ log V0_bin จำนวน 20 ตัว + log ℓ ระดับโลก 1 ตัว) ตระกูล EFT เหนือกว่า DM_RAZOR อย่างมีนัยสำคัญในการฟิตร่วม: ΔlogL_total = 1155–1337 เมื่อเทียบกับ DM_RAZOR ที่สำคัญกว่านั้น การทดสอบปิดวงจรแสดงว่าโพสทีเรียร์ของ RC มีพลังพยากรณ์ต่อ GGL ที่ไม่ใช่เรื่องเล็กน้อย: ความแรงการปิดวงจรของ EFT คือ ΔlogL_closure = 172–281 สูงกว่า 127 ของ DM_RAZOR เมื่อสุ่มสลับการจัดกลุ่ม RC-bin→GGL-bin สัญญาณการปิดวงจรยุบลงเหลือ 6–23 ยืนยันว่าสัญญาณนี้ไม่ใช่เหตุบังเอิญทางสถิติหรืออาร์ติแฟกต์จากการใช้งาน ในการสแกนระบบตาม σ_int, R_min และ covariance shrinkage ความได้เปรียบสัมพัทธ์ของ EFT ยังคงเป็นบวกและมีขนาดเสถียร เพื่อจัดการข้อกังวลทั่วไปว่า “เส้นฐาน DM อ่อนเกินไป” หรือ “ระบบผิดพลาดถูกเข้าใจผิดว่าเป็นฟิสิกส์” ภาคผนวก B (P1A) จึงให้การทดสอบแรงกดดันของเส้นฐาน DM ที่เป็นมาตรฐานกว่าแต่ยังมีมิติต่ำและตรวจสอบได้ รวมถึง hierarchical c–M scatter + prior, core proxy หนึ่งพารามิเตอร์, lensing m และแบบจำลองรวม DM_STD ภายใต้โปรโตคอลปิดวงจรเดียวกัน การเสริมเหล่านี้ไม่ได้ลบความได้เปรียบด้านการปิดวงจรของ EFT (ดูตาราง B1/รูป B1)
คำสำคัญ: เส้นโค้งการหมุน; เลนส์ความโน้มถ่วงอ่อนระหว่างดาราจักร; การทดสอบปิดวงจร; EFT; สสารมืดเย็น; การอนุมานแบบเบย์
2 บทนำและภาพรวมผลลัพธ์
เส้นโค้งการหมุน (RC) และเลนส์ความโน้มถ่วงอ่อนระหว่างดาราจักร (GGL) เป็นโพรบแรงโน้มถ่วงสองชนิดที่เสริมกัน: RC จำกัดศักย์พลวัตและความสัมพันธ์ความเร่งแนวรัศมี (RAR) ในระนาบจาน ส่วน GGL วัดการกระจายมวลแบบฉายและการตอบสนองแรงโน้มถ่วงในสเกลฮาโล สำหรับทฤษฎีผู้สมัครใด ๆ คำถามสำคัญไม่ใช่ว่ามันสามารถฟิตชุดข้อมูลสองชุดแยกกันได้หรือไม่ แต่คือมันสามารถอธิบายทั้งสองอย่างสอดคล้องกันภายใต้การจับคู่ข้ามข้อมูลและข้อจำกัดร่วมเดียวกันได้หรือไม่
ดังนั้น บทความนี้ใช้ “การทดสอบปิดวงจร” เป็นโปรโตคอลสถิติแกนกลาง: ขั้นแรกใช้โพสทีเรียร์แบบ RC-only เพื่อพยากรณ์ GGL ไปข้างหน้า จากนั้นเปรียบเทียบกับตัวควบคุมเชิงลบที่ทำการ permute/shuffle การจับคู่ RC-bin→GGL-bin ขั้นตอนนี้ประเมินความสามารถในการถ่ายโอนพยากรณ์ข้ามข้อมูลและตัดสัญญาณเทียมที่เกิดจากอคติในการใช้งานหรือการฟิตโดยบังเอิญออกไป
การวางตำแหน่งและขอบเขตทางทฤษฎี: บทความนี้ไม่ได้พยายามนำเสนอการอนุมานหลักการจุลภาคลำดับแรกของ EFT (ทฤษฎีเส้นใยพลังงาน) หรือสูตรที่สมบูรณ์เชิงสัมพัทธภาพ ในทางกลับกัน เราปฏิบัติต่อ EFT เป็นพารามิเตอร์ไรเซชันมิติต่ำแบบ MOND-like ของสนามมีผล/การตอบสนองมีผล (อธิบายด้วยเคอร์เนล f(x) และสเกลระดับโลก ℓ) และทดสอบความสอดคล้องข้ามข้อมูลกับพลังพยากรณ์ในการถ่ายโอนผ่านการทดสอบปิดวงจร RC→GGL ภายใต้บัญชีพารามิเตอร์ที่เข้มงวด
ถ้อยแถลงว่าด้วยโครงการวิจัยและขอบเขต: บทความนี้เป็นส่วนหนึ่งของโครงการสืบค้นเชิงสังเกตการณ์ชุด P ที่กำลังดำเนินต่อไป ในข้อมูลสเกลดาราจักรที่มีอยู่ เราค้นหาการมีส่วนร่วมพื้นหลังมีผลที่เป็นไปได้สองชนิด: (i) “ฐานแรงโน้มถ่วงเฉลี่ย” ที่อธิบายได้ด้วยการตอบสนองแรงโน้มถ่วงเฉลี่ยหลัง coarse-graining และ (ii) “ฐานสุ่ม/ฐานเสียงรบกวน” ที่เกี่ยวข้องกับความผันผวนของกระบวนการจุลภาค ในบทความนี้ (P1) เรามุ่งเฉพาะชนิดแรก: โดยไม่แนะนำสมมติฐานใด ๆ เกี่ยวกับกลไกการเกิดระดับจุลภาค เราใช้การทดสอบปิดวงจร RC→GGL เพื่อสืบค้นร่องรอยเชิงสังเกตของฐานแรงโน้มถ่วงเฉลี่ยและเปรียบเทียบกับเส้นฐาน DM ที่ตรวจสอบได้ภายใต้โปรโตคอลควบคุมแบบรวม ในฐานะภาพทางฟิสิกส์เชิงชี้นำ หากมีดีกรีอิสระอายุสั้นอยู่จริง การสลาย/การทำลายล้างของมันสามารถแปลงมวลนิ่งเป็นพลังงาน-โมเมนตัมที่ดีกรีอิสระอื่นพาไป ซึ่งสอดคล้องตามธรรมชาติในระดับมีผลกับการแยก “ส่วนเฉลี่ย + ส่วนผันผวน”; อย่างไรก็ตาม บทความนี้ไม่ได้สร้างแบบจำลองเชิงปริมาณให้ภาพจุลภาคดังกล่าว
เพื่อหลีกเลี่ยงการตีความเกินขอบเขต ขอบเขตของบทความนี้เป็นดังนี้:
• สิ่งที่บทความนี้ทำ: ภายใต้ข้อจำกัดบัญชีพารามิเตอร์และการจับคู่ร่วมที่เข้มงวด ใช้การทดสอบปิดวงจรเพื่อวัดความสามารถในการถ่ายโอนพยากรณ์ข้ามข้อมูล และทำการเปรียบเทียบที่ทำซ้ำได้ระหว่างการตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT กับเส้นฐาน DM
• สิ่งที่บทความนี้ไม่ทำ: ไม่อภิปรายกลไกการเกิดระดับจุลภาค ความอุดมสมบูรณ์/อายุขัย หรือข้อจำกัดจักรวาลวิทยา; ไม่สร้างแบบจำลองเทอมสุ่มที่สอดคล้องกับ “ฐานเสียงรบกวน”
• สิ่งที่บทความนี้ไม่ได้อ้าง: ไม่มุ่งล้มล้างสสารมืด; P1 ไม่ให้คำตัดสินสุดท้ายว่า “ฐาน” มีอยู่หรือไม่ แต่รายงานหลักฐานระดับระยะว่า ภายในโดเมนการวัดที่แข็งแรงซึ่งเลือกไว้ในที่นี้ ข้อมูลโน้มเอียงไปยังแบบจำลองที่มีการตอบสนองแรงโน้มถ่วงเฉลี่ย
ขณะเดียวกัน เราชี้แจงว่า DM_RAZOR เป็นเพียงเส้นฐาน NFW ขั้นต่ำที่ตรวจสอบได้ (c–M คงที่และไม่มี scatter; ไม่มี adiabatic contraction, feedback core, ความไม่ทรงกลม หรือเทอมสิ่งแวดล้อม) ดังนั้น ข้อสรุปหลักของเนื้อหาหลักจึงจำกัดอย่างเข้มงวดอยู่ที่ถ้อยคำนี้: ภายใต้เส้นฐานขั้นต่ำและข้อจำกัดบัญชีพารามิเตอร์/การจับคู่ที่เข้มงวด EFT แสดงความสอดคล้องข้ามข้อมูลที่แข็งแรงกว่า เพื่อจัดการคำถามทั่วไปว่าเส้นฐาน ΛCDM ที่เป็นมาตรฐานมากกว่าและการสร้างแบบจำลองระบบผิดพลาดด้านเลนส์ที่สำคัญจะเปลี่ยนข้อสรุปอย่างมีนัยสำคัญหรือไม่ เราจึงรวบรวมการเสริม DM ที่เป็นมาตรฐานขึ้นแต่ยังมีมิติต่ำและตรวจสอบได้ พร้อม nuisance ฝั่งเลนส์ไว้ในภาคผนวก B (P1A: การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน) โดยคงการจับคู่ร่วมและโปรโตคอลทดสอบปิดวงจรเหมือนกับเนื้อหาหลักทุกประการ (ดูตาราง B1/รูป B1)
2.1 ตาราง S1a–S1b: สรุปตัวชี้วัดหลัก (Strict)
ตาราง S1a รายงานตัวชี้วัดเปรียบเทียบหลักสำหรับการฟิตร่วม (RC+GGL): logL, ΔlogL, AICc และ BIC ตาราง S1b รายงานตัวชี้วัดของการทดสอบปิดวงจรและการสแกนความทนทาน ได้แก่ closure, ตัวควบคุมเชิงลบแบบ shuffle และช่วงสแกน σ_int / R_min / cov-shrink ค่าทั้งหมดมาจากตารางสรุปหลักแบบ strict ชื่อ Tab_Z1_master_summary และสามารถสืบย้อนเป็นรายการ ๆ ได้ในแพ็กเกจคลังเผยแพร่
ตาราง S1a | ตัวชี้วัดเปรียบเทียบหลักของการฟิตร่วม (RC+GGL, Strict)
แบบจำลอง (workspace) | เคอร์เนล W | k | joint logL_total (ดีที่สุด) | ΔlogL_total เทียบกับ DM | AICc | BIC |
DM_RAZOR | none | 20 | -16927.763 | 0.0 | 33895.885 | 34010.811 |
EFT_BIN | none | 21 | -15590.552 | 1337.21 | 31223.501 | 31344.155 |
EFT_WEXP | exponential | 21 | -15668.83 | 1258.932 | 31380.057 | 31500.711 |
EFT_WYUK | yukawa | 21 | -15772.936 | 1154.827 | 31588.268 | 31708.922 |
EFT_WPOW | powerlaw_tail | 21 | -15633.321 | 1294.442 | 31309.038 | 31429.692 |
ตาราง S1b | ตัวชี้วัดการปิดวงจรและความทนทาน (Strict)
แบบจำลอง (workspace) | ΔlogL ของ closure (true-perm) | ΔlogL ของตัวควบคุมเชิงลบหลัง shuffle | ช่วง ΔlogL ในการสแกน σ_int | ช่วง ΔlogL ในการสแกน R_min | ช่วง ΔlogL ในการสแกน cov-shrink |
DM_RAZOR | 126.678 | 22.725 | — | — | — |
EFT_BIN | 231.611 | 14.984 | 459–1548 | 1243–1289 | 1337–1351 |
EFT_WEXP | 171.977 | 6.04 | 408–1471 | 1169–1207 | 1259–1277 |
EFT_WYUK | 179.808 | 14.688 | 380–1341 | 1065–1099 | 1155–1166 |
EFT_WPOW | 280.513 | 6.672 | 457–1500 | 1203–1247 | 1294–1308 |
2.2 รูป S3: ความแรงการปิดวงจร (RC-only → GGL ที่พยากรณ์)
ความแรงการปิดวงจรถูกนิยามเป็น ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: ใช้ตัวอย่างโพสทีเรียร์แบบ RC-only เพื่อพยากรณ์ GGL ไปข้างหน้า แล้วเปรียบเทียบกับตัวควบคุมเชิงลบที่มีการ permute การจับคู่ RC-bin→GGL-bin

รูป S3 | ความแรงการปิดวงจร (ยิ่งสูงยิ่งดี): ความได้เปรียบ log-likelihood เฉลี่ยของการพยากรณ์ RC-only → GGL
2.3 รูป S4: การเปรียบเทียบการฟิตร่วมหลัก (RC+GGL)
ความได้เปรียบในการฟิตร่วมนิยามเป็น ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR) ภายใต้ข้อมูลเดียวกัน การจับคู่เดียวกัน และขนาดพารามิเตอร์เกือบเท่ากัน ตระกูล EFT ให้ค่า joint log-likelihood สูงกว่าอย่างมีนัยสำคัญ

รูป S4 | ความได้เปรียบการฟิตร่วม (ยิ่งสูงยิ่งดี): ค่า logL_total ที่ดีที่สุดสำหรับ RC+GGL เมื่อเทียบกับ DM_RAZOR
2.4 ข้อสรุปสี่ข้อ (อ้างอิงได้โดยตรง)
(1) ในการวิเคราะห์ร่วมแบบรวมของเส้นโค้งการหมุน SPARC และเลนส์ความโน้มถ่วงอ่อน KiDS-1000 แบบจำลองกรอบแรงโน้มถ่วงเฉลี่ยของ EFT เหนือกว่า DM_RAZOR อย่างเป็นระบบภายใต้โปรโตคอลควบคุมที่เข้มงวด: ΔlogL_total = 1155–1337 เมื่อเทียบกับ DM_RAZOR
(2) การทดสอบปิดวงจร RC→GGL แสดงความสอดคล้องเชิงพยากรณ์ที่แข็งแรงกว่าสำหรับ EFT: ΔlogL_closure = 172–281 เทียบกับ 127 สำหรับ DM_RAZOR เมื่อสุ่มสลับการจัดกลุ่ม RC-bin→GGL-bin สัญญาณปิดวงจรยุบลงเหลือ 6–23 แสดงว่าสัญญาณขึ้นอยู่กับการจับคู่ข้ามข้อมูลที่ถูกต้อง ไม่ใช่การฟิตโดยบังเอิญ
(3) การสแกนระบบของ σ_int, R_min และ covariance shrinkage ไม่เปลี่ยนเครื่องหมายหรือขนาดของ “EFT เหนือกว่า DM_RAZOR” บ่งชี้ว่าข้อสรุปทนทานต่อการรบกวนเชิงระบบที่พบบ่อย
(4) ภายใต้โปรโตคอลปิดวงจรเดียวกัน ภาคผนวก B (P1A) เสริมเส้นฐาน DM ในแบบ “เป็นมาตรฐานและตรวจสอบได้”: คงการเสริมแบบหนึ่งพารามิเตอร์สามรายการ (SCAT/AC/FB) และเพิ่ม hierarchical c–M scatter + prior, core proxy หนึ่งพารามิเตอร์ และ shear-calibration m ฝั่งเลนส์ (รวมทั้งแบบจำลองรวม DM_STD) ผลลัพธ์แสดงว่าเฉพาะกิ่ง feedback/core เท่านั้นที่ให้การปรับปรุงสุทธิเล็กน้อยต่อความแรงการปิดวงจร (122.21→129.45, ΔΔlogL_closure≈+7.25); การเสริมอื่น ๆ มีผลเล็กน้อยมากหรือเป็นลบต่อความแรงการปิดวงจร ดังนั้นข้อสรุปหลักไม่ได้ขึ้นอยู่กับการที่ DM_RAZOR เป็นเส้นฐานที่อ่อนเกินไป
3 ข้อมูลและการเตรียมข้อมูล
การศึกษานี้ใช้ชุดข้อมูลสาธารณะสองชุด ภายในเวิร์กโฟลว์เชิงวิศวกรรม การดาวน์โหลด การตรวจสอบ checksum (sha256) และการเตรียมข้อมูลดำเนินด้วยสคริปต์ที่สืบย้อนกลับได้ เพื่อให้การเปรียบเทียบข้ามแบบจำลองเป็นธรรม workspace ทั้งหมด (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) ใช้ผลิตภัณฑ์ข้อมูลและการจับคู่ bin ชุดเดียวกันทุกประการ
3.1 เส้นโค้งการหมุน (RC, SPARC)
ข้อมูล RC มาจากไฟล์ Rotmod_LTG ของฐานข้อมูล SPARC (ไฟล์ rotmod 175 ไฟล์) หลังการเตรียมข้อมูล ตัวอย่างสำหรับการสร้างแบบจำลองมี 104 ดาราจักรและจุดข้อมูล (r, V_obs) จำนวน 2,295 จุด แบ่งเป็น 20 RC bins ตามมวลดาวและเกณฑ์ที่เกี่ยวข้อง จุดข้อมูลแต่ละจุดประกอบด้วยรัศมี r (kpc), ความเร็วสังเกต V_obs (km/s), ความคลาดเคลื่อนสังเกต σ_obs และความเร็วองค์ประกอบแก๊ส/จาน/ป่องกลาง (V_gas, V_disk, V_bul)
3.2 เลนส์ความโน้มถ่วงอ่อน (GGL, KiDS-1000 / Brouwer+2021)
ข้อมูล GGL ใช้ความหนาแน่นผิวส่วนเกิน ΔΣ(R) จากรูปที่ 3 ของ Brouwer et al. (2021) อิง KiDS-1000 (4 bin มวลดาว, 15 จุด R ต่อ bin) พร้อม covariance เต็มที่ให้มา ในเวิร์กโฟลว์เชิงวิศวกรรม covariance แบบ long-form เดิมถูกสร้างใหม่เป็นเมทริกซ์ 15×15 สำหรับแต่ละ bin และการตรวจสอบ Stage-B ตรวจสอบความสมเหตุสมผลด้านมิติและตัวเลข
3.3 การจับคู่ RC-bin → GGL-bin และขนาดตัวอย่างรวม
bin มวล GGL จำนวน 4 bin และ RC bins จำนวน 20 bin เชื่อมกันผ่านการจับคู่คงที่: GGL bin แต่ละ bin สอดคล้องกับ RC bins 5 bin และถ่วงน้ำหนักการมีส่วนร่วมของ RC-bin ตามจำนวนดาราจักร การจับคู่นี้ถูกตรึงไว้เหมือนกันในทุกแบบจำลอง และเป็นข้อจำกัดแกนกลางสำหรับการเปรียบเทียบอย่างเป็นธรรมในการทดสอบปิดวงจรและการฟิตร่วม ชุดข้อมูลร่วมสุดท้ายมี n_total = 2355 จุด (RC=2295, GGL=60)
4 แบบจำลองและวิธีการทางสถิติ
4.1 ข้อกำหนดทางคณิตศาสตร์ขั้นต่ำสำหรับ EFT และ DM (ตรวจสอบได้/ทดสอบได้)
หัวข้อนี้ให้ข้อกำหนดทางคณิตศาสตร์ขั้นต่ำที่เชื่อมตรงกับการใช้งานจริง
(a) แบบจำลองเส้นโค้งการหมุน (RC)
สำหรับจุดข้อมูล RC แต่ละจุด (r, V_obs, σ_obs) เราใช้การซ้อนทับขององค์ประกอบ: V_mod²(r) = V_bar²(r) + V_extra²(r) โดย V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r) ผลลัพธ์หลักในบทความนี้ใช้ Υ_d = Υ_b = 0.5 ซึ่งสอดคล้องกับคำแนะนำเชิงประจักษ์ของ SPARC และช่วยลดดีกรีอิสระที่ไม่จำเป็น
(b) การแก้ไขแรงโน้มถ่วงเฉลี่ยของ EFT (EFT)
เทอมส่วนเพิ่มของ EFT ถูกทำพารามิเตอร์ในรูป “ความเร็วเฉลี่ยยกกำลังสอง”: V_extra²(r) = V0_bin² · f(r/ℓ) โดย V0_bin คือพารามิเตอร์แอมพลิจูดของ RC bin แต่ละ bin (20 พารามิเตอร์), ℓ คือสเกลระดับโลก (1 พารามิเตอร์), และ f(x) คือฟังก์ชันรูปร่างเคอร์เนลไร้มิติ รูปร่างเคอร์เนลที่เปรียบเทียบในบทความนี้ (ไม่มีแบบใดเพิ่มดีกรีอิสระต่อเนื่องเพิ่มเติม) ได้แก่:
- none: f(x)=x/(1+x)
- exponential: f(x)=1−exp(−x)
- yukawa: f(x)=1−exp(−x)·(1+0.5x)
- powerlaw_tail: f(x)=1−(1+x)^(−1/2)
- (ตัวควบคุมทางเลือก) gaussian: f(x)=erf(x/√2) (ไม่รวมในชุดข้อสรุปหลัก)
แรงจูงใจทางฟิสิกส์ (ขยาย): EFT ตีความการตอบสนองแรงโน้มถ่วงส่วนเพิ่มในสเกลดาราจักรว่าเป็นการตอบสนองมีผลที่ได้จากการทำ coarse-graining/scale-averaging ของการกระทำจุลภาคมากขึ้นบนสเกลจำกัด ในบทความนี้ เราไม่สมมติกลไกจุลภาคเฉพาะใด ๆ แต่ใช้พารามิเตอร์ไรเซชันขั้นต่ำที่ตรวจสอบได้เพื่อการเปรียบเทียบแบบควบคุมและการทดสอบภายใต้โปรโตคอลสถิติแบบรวม
เพื่อช่วยสร้างสัญชาตญาณ เทอมส่วนเพิ่มสามารถเขียนในรูปความเร่งได้ว่า a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ) เมื่อ r≫ℓ, f→1 และ V_extra→V0_bin ทำให้เกิดส่วนเพิ่มความเร็วบริเวณนอกที่เกือบแบน เมื่อ r≪ℓ และ f(x)≈x สามารถนิยามสเกลความเร่งลักษณะ a0,bin≈V0_bin²/ℓ ได้ (ต่างกันด้วยปัจจัยฟังก์ชันเคอร์เนลลำดับ O(1)) ซึ่งให้สัญชาตญาณแบบ MOND-like สำหรับสเกลการเปลี่ยนผ่านจากด้านในสู่ด้านนอก
ตระกูลเคอร์เนลไม่ต่อเนื่องที่ใช้ที่นี่ (none/exponential/yukawa/powerlaw_tail) สามารถมองเป็นตัวแทนมิติต่ำของ “ความชันเริ่มต้น / ความเร็วการเปลี่ยนผ่าน / หางระยะไกล” ที่แตกต่างกัน (เช่น การ screen แบบ Yukawa เทียบกับการตอบสนองที่มีหางยาวกว่า) พวกมันถูกใช้เพื่อทดสอบแรงกดดันด้านความทนทาน ไม่ใช่เพื่อสำรวจปริภูมิแบบจำลองให้หมด ในองค์ประกอบเลนส์ความโน้มถ่วงอ่อน เราสร้างมวลและความหนาแน่นของ envelope มีผลจาก V_avg(r) แล้วฉายเพื่อให้ได้ ΔΣ(R) ความหนาแน่นมีผลนี้ควรเข้าใจว่าเป็นคำอธิบายมีผลของศักย์เลนส์ภายใต้สมมติฐานสมมาตรทรงกลมและการจับคู่สนามอ่อน (รายละเอียดเต็มย้ายไปไว้ในภาคผนวก A)
รูปร่างเคอร์เนลทั้งหมดข้างต้นเป็นไปตาม f(x)→1 เมื่อ x→∞ (กล่าวคือ V_extra² อิ่มตัวสู่ V0²) และให้การเติบโตเชิงเส้นหรือกึ่งเชิงเส้นสำหรับ x≪1 เช่น exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x ดังนั้นรูปร่างเคอร์เนลต่าง ๆ จึงมีความแตกต่างที่สังเกตได้ใน “ความชันเริ่มต้น” ที่รัศมีเล็ก ความเร็วการเปลี่ยนผ่าน และหางด้านนอก และสามารถแยกแยะได้ด้วยการฟิตร่วม RC+GGL และการทดสอบปิดวงจร
คำพยากรณ์ของ EFT สำหรับ ΔΣ(R) ของเลนส์ความโน้มถ่วงอ่อนได้จากการอนุมานมวล envelope และความหนาแน่นจาก V_avg(r) แล้วตามด้วยอินทิกรัลการฉาย: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr และ ΔΣ(R)=Σ̄(<R)−Σ(R) การใช้งานเชิงตัวเลขใช้กริดลอการิทึมและปรับละเอียดแบบปรับตัวในกรณีพิเศษเพื่อรับประกันเสถียรภาพและการทำซ้ำผล
(c) DM_RAZOR: เส้นฐานฮาโล NFW ของสสารมืดเย็น
ขณะเดียวกัน เราชี้แจงว่า DM_RAZOR เป็นเพียงเส้นฐาน NFW ขั้นต่ำที่ตรวจสอบได้ (c–M คงที่และไม่มี scatter; ไม่มี adiabatic contraction, feedback core, ความไม่ทรงกลม หรือเทอมสิ่งแวดล้อม) เพื่อลดความเสี่ยงของ “เส้นฐานหุ่นฟาง” บทความนี้ไม่ได้อ้างว่าผลดังกล่าวไม่มีอยู่ แต่รวมมันไว้ในภาคผนวก B (P1A) ในฐานะการทดสอบแรงกดดันมิติต่ำที่ตรวจสอบได้ รวมถึงการจัดการ c–M scatter แบบลำดับชั้น, core proxy และ nuisance ของ shear-calibration ฝั่งเลนส์
4.2 บัญชีแบบจำลองและการเปรียบเทียบอย่างเป็นธรรม (พารามิเตอร์ร่วม = นิยามของการปิดวงจร)
จำนวนพารามิเตอร์ในชุดเปรียบเทียบหลักคือ: DM_RAZOR k=20; ตระกูล EFT k=21 (พารามิเตอร์ที่เพิ่มคือ log ℓ ระดับโลก) แบบจำลองทั้งหมดใช้ข้อมูล RC เดียวกัน ข้อมูล GGL และ covariance เดียวกัน การจับคู่ RC-bin→GGL-bin เดียวกัน เทอม baryonic เดียวกัน และการแปลงหน่วยเดียวกัน นอกจากนี้ รูปร่างเคอร์เนล (none / exponential / yukawa / powerlaw_tail) เป็นตัวเลือกไม่ต่อเนื่องและไม่เพิ่มพารามิเตอร์ต่อเนื่องเพิ่มเติม จึงป้องกันไม่ให้ได้เปรียบจาก “ดีกรีอิสระเพิ่มอีกหนึ่งตัว”
4.3 Likelihood, Priors และ Sampler
likelihood ของ RC เป็น Gaussian แนวทแยง: σ_eff² = σ_obs² + σ_int² ผลลัพธ์หลักตรึง σ_int=5 km/s และ Run-5 สแกน σ_int likelihood ของ GGL ใช้ Gaussian แบบ covariance เต็มสำหรับแต่ละ bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b) เป้าหมายร่วมคือ logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ) ไพรเออร์ส่วนใหญ่เข้ารหัสขอบเขตที่เป็นไปได้ทางฟิสิกส์ (ข้อจำกัดช่วงของ log ℓ, log V0 และ log M200); เมื่อเปิดใช้งาน Υ และ σ_int แบบอิสระ จะใช้ไพรเออร์ให้ข้อมูลอ่อน (ดูรายละเอียดในการใช้งานและการตั้งค่าแพ็กเกจเผยแพร่)
ตัวสุ่มตัวอย่างใช้ adaptive block Metropolis random walk: แต่ละขั้นอัปเดตเฉพาะ sub-block แบบสุ่มของปริภูมิพารามิเตอร์เพื่อเพิ่มอัตราการยอมรับในมิติสูง และปรับขนาดก้าวเล็กน้อยตามอัตราการยอมรับแบบ windowed (อัตรายอมรับเป้าหมายประมาณ 0.25) ผลลัพธ์หลักใช้ quick mode (เช่น n_steps=800) และ workspace แต่ละชุดส่งออก traces, residuals และ PPC plots สำหรับการตรวจสอบทั้งด้วยมือและสคริปต์
4.4 การทดสอบปิดวงจรและตัวควบคุมเชิงลบ (นิยาม)
การทดสอบปิดวงจร (Run-2) ทดสอบว่าโพสทีเรียร์แบบ RC-only สามารถพยากรณ์ GGL โดยไม่ต้องฟิต GGL ใหม่ได้หรือไม่ โดยเฉพาะ มันสร้าง ΔΣ(R) ไปข้างหน้าสำหรับ GGL 4 bins จากตัวอย่างโพสทีเรียร์ RC-only และคำนวณ logL_true ด้วย covariance เต็ม จากนั้นสุ่ม permute การจับคู่กลุ่ม RC-bin→GGL-bin เพื่อให้ได้ logL_perm ความแรงการปิดวงจรนิยามเป็น ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩ นอกจากนี้ Run-10 สุ่มจัดกลุ่ม RC bins 20 bin ใหม่เป็น 4×5 (shuffle) และคำนวณ closure ใหม่ เพื่อตรวจว่าการปิดวงจรขึ้นกับการจับคู่ที่ถูกต้องแรงเพียงใด
5 ผลลัพธ์หลักและการตีความ
5.1 ผลลัพธ์การฟิตร่วมหลัก (RC+GGL)
ค่า logL_total ที่ดีที่สุดจากการฟิตร่วมและความได้เปรียบสัมพัทธ์ ΔlogL_total (เทียบกับ DM_RAZOR) แสดงไว้ในตาราง S1a และรูป S4 ในชุดเปรียบเทียบหลัก EFT_BIN มีความได้เปรียบในการฟิตร่วมมากที่สุด (ΔlogL_total=1337.210) ขณะที่รูปร่างเคอร์เนล EFT อื่น ๆ ก็ยังคงความได้เปรียบอย่างมีนัยสำคัญ (1154.827–1294.442) ภายใต้เกณฑ์สารสนเทศ (AICc/BIC) ตระกูล EFT ก็เหนือกว่า DM_RAZOR อย่างมีนัยสำคัญเช่นกัน แสดงว่าความได้เปรียบไม่ได้เกิดจากอคติด้านจำนวนพารามิเตอร์
หมายเหตุ: ส่วนหลักของ ΔlogL_total≈1337 มาจากเทอม RC (ΔlogL_RC≈1065 ในการแยกองค์ประกอบการฟิตร่วม ประมาณ 80%) สิ่งนี้เข้าใจได้ว่าเป็นการปรับปรุงปานกลางราว Δχ²≈0.90 ต่อจุดในข้อมูล RC จำนวน N=2295 จุด ซึ่งสะสมโดยธรรมชาติเป็นความได้เปรียบลำดับ 10^3 ภายใต้ likelihood Gaussian แนวทแยง ในเวลาเดียวกัน GGL และการทดสอบปิดวงจรให้ข้อจำกัดข้ามชุดข้อมูลที่เป็นอิสระ และลำดับอันดับยังคงเสถียรภายใต้การทดสอบแรงกดดัน σ_int, R_min และ cov-shrink (ดูหัวข้อ 6 และตาราง S1b)
5.2 ผลลัพธ์การทดสอบปิดวงจร (RC-only → GGL)
ปริมาณสำคัญของการทดสอบปิดวงจร ΔlogL_closure รายงานไว้ในตาราง S1b และรูป S3 ตระกูล EFT มีความแรงการปิดวงจร 171.977–280.513 สูงกว่า 126.678 ของ DM_RAZOR หมายความว่า เมื่อไม่อนุญาตดีกรีอิสระข้ามข้อมูลเพิ่มเติม ตัวอย่างโพสทีเรียร์ที่ EFT ได้จากข้อมูล RC มีพลังพยากรณ์ที่ถ่ายโอนได้สู่ข้อมูล GGL แข็งแรงกว่า
ตัวควบคุมเชิงลบสนับสนุนความหมายทางฟิสิกส์ของสัญญาณปิดวงจรเพิ่มเติม: เมื่อสุ่ม shuffle การจัดกลุ่ม RC-bin→GGL-bin ความแรงการปิดวงจรของ EFT ลดลงเหลือ 6–15 (ต่างกันเล็กน้อยระหว่างเคอร์เนล) ในขณะที่ความแรงการปิดวงจรฐานสูงถึง 172–281 “การยุบตัวของสัญญาณ” นี้ตัดความได้เปรียบเทียมที่เกิดจากการใช้งานเชิงตัวเลข ข้อผิดพลาดหน่วย หรือการจัดการ covariance ที่ไม่เหมาะสมออกไป

รูป R1 | ตัวควบคุมเชิงลบ: หลัง shuffle grouping สัญญาณปิดวงจรลดลงอย่างมีนัยสำคัญ (วาดจากตัวชี้วัด Tab_Z1)
5.3 ความหมายและขีดจำกัดของผลลัพธ์
ข้อสรุปของการศึกษานี้คือ “ภายใต้ชุดข้อมูลและโปรโตคอลนี้ การแก้ไขแรงโน้มถ่วงเฉลี่ยของ EFT เหนือกว่าเส้นฐาน DM_RAZOR ที่ทดสอบแล้ว” ต้องเน้นว่าฝั่ง DM ใช้เพียงเส้นฐาน NFW ขั้นต่ำที่มีความสัมพันธ์ c(M) คงที่ โดยไม่มีการก่อตัว core, ความไม่ทรงกลม, เทอมสิ่งแวดล้อม หรือแบบจำลองการเชื่อมต่อดาราจักร–ฮาโลที่ซับซ้อนกว่า ดังนั้นต้นฉบับนี้ไม่ได้อ้างว่าตัดแบบจำลอง DM ทุกตระกูลออก แต่ให้เส้นฐานควบคุมที่ทำซ้ำได้และยึดการทดสอบปิดวงจรเป็นแกน เพื่อประเมินว่า RC และ GGL สามารถอธิบายอย่างสอดคล้องด้วยพารามิเตอร์และการจับคู่ข้ามข้อมูลเดียวกันได้หรือไม่
เพื่อจัดการข้อกังวลทั่วไปนี้ เราดำเนินโครงการขยายอิสระ P1A เสร็จสมบูรณ์ (ดูภาคผนวก B) โดยไม่เปลี่ยนการจับคู่ร่วม RC-bin→GGL-bin หรือกรอบการตรวจสอบ โครงการนี้เสริมเส้นฐาน DM ในแบบ “เป็นมาตรฐานและตรวจสอบได้”: นอกจากการเสริมหนึ่งพารามิเตอร์สามรายการ (SCAT/AC/FB) ยังเพิ่ม (i) hierarchical c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) core proxy จาก baryonic feedback หนึ่งพารามิเตอร์ (DM_CORE1P), และ (iii) nuisance m ของ shear-calibration ฝั่งเลนส์ความโน้มถ่วงอ่อน (DM_RAZOR_M) พร้อมรายงานแบบจำลองรวม DM_STD; EFT_BIN ถูกคงไว้เป็นอ้างอิงควบคุม
• DM_RAZOR_SCAT (c–M scatter) — แนะนำพารามิเตอร์ scatter ของความเข้มข้นระหว่างฮาโล σ_logc เพื่อทดสอบว่า c(M) แบบคงที่ประเมินพลังอธิบายของ DM ต่ำไปอย่างเป็นระบบหรือไม่;
• DM_RAZOR_AC (Adiabatic Contraction) — ใช้พารามิเตอร์เดี่ยว α_AC เพื่ออินเตอร์โพเลตต่อเนื่องระหว่าง “ไม่มีการหดตัว” กับ “การหดตัวมาตรฐาน” โดยจับแนวโน้มที่ baryon ทำให้ฮาโลส่วนในหดตัวด้วยต้นทุนมิติต่ำ;
• DM_RAZOR_FB (Feedback/core) — ใช้สเกล core (เช่น log r_core) เพื่ออธิบายว่าการก่อตัวของ core ด้านในกดเส้นโค้งการหมุนอย่างไร พร้อมคงการประมาณ NFW ในสเกลเลนส์ความโน้มถ่วงอ่อน
scoreboard เชิงปริมาณของ P1A ให้ไว้ในภาคผนวก B ตาราง B1 / รูป B1 (สร้างอัตโนมัติจาก Tab_S1_P1A_scoreboard) ในตัวชี้วัดปิดวงจร DM_RAZOR_FB ให้การปรับปรุงสุทธิเล็กน้อย (122.21→129.45, +7.25) ขณะที่การเสริมอื่น ๆ มีผลเล็กน้อยมากหรือเป็นลบต่อความแรงการปิดวงจร ด้านการฟิตร่วม การเพิ่ม hierarchical c–M scatter prior (DM_HIER_CMSCAT) หรือแบบจำลองรวม (DM_STD) สามารถปรับปรุง joint logL ได้มาก แต่ไม่ได้เพิ่มความแรงการปิดวงจร สื่อว่ามันเพิ่มความยืดหยุ่นในการฟิตร่วมเป็นหลัก ไม่ใช่ความสามารถในการถ่ายโอนข้ามโพรบ ดังนั้นข้อสรุปแกนกลางของเนื้อหาหลักควรอ่านดังนี้: ภายใต้ข้อจำกัดการจับคู่ร่วมและการทดสอบปิดวงจรที่เข้มงวด ความได้เปรียบด้านความสอดคล้องข้ามข้อมูลของ EFT ไม่ได้เกิดจากการเลือก “เส้นฐานที่อ่อนเกินไป” ฝั่ง DM แพ็กเกจเผยแพร่ P1A ที่สอดคล้องกับภาคผนวก B (ตาราง/รูปเสริมและ full_fit_runpack) จะถูกรวมเป็นไฟล์เพิ่มเติมภายใต้ Zenodo Concept DOI เดียวกับ full_fit_runpack ของบทความนี้: https://doi.org/10.5281/zenodo.18526286
6 การทดลองด้านความทนทานและการควบคุม
6.1 การสแกน σ_int (Run-5)
เราสแกน intrinsic RC scatter σ_int อย่างเป็นระบบ และทำการอนุมานร่วมซ้ำที่ค่า σ_int แต่ละค่า โดยคำนวณ ΔlogL_total เมื่อเทียบกับ DM_RAZOR ค่าต่ำสุด/สูงสุดของ ΔlogL_total สำหรับแต่ละแบบจำลองตลอดช่วงสแกนถูกรายงานในตาราง S1b

รูป R2 | ช่วงของ ΔlogL_total ภายใต้การสแกน σ_int (ยิ่งสูงยิ่งดี)
6.2 การสแกน R_min (Run-6)
เพื่อทดสอบผลกระทบของระบบผิดพลาดในข้อมูลบริเวณกลาง (เช่น การเคลื่อนที่ไม่เป็นวงกลม ความละเอียด และการสร้างแบบจำลอง baryonic ไม่เพียงพอ) เราใช้การตัด threshold R_min กับ RC และทำการอนุมานร่วมซ้ำ ความได้เปรียบของตระกูล EFT ยังคงเป็นบวกและเสถียรในขนาดภายใต้การสแกน R_min

รูป R3 | ช่วงของ ΔlogL_total ภายใต้การสแกน R_min (ยิ่งสูงยิ่งดี)
6.3 การสแกน cov-shrink (Run-7)
เพื่อทดสอบความไม่แน่นอนใน covariance ของ GGL เราใช้ shrinkage กับเมทริกซ์ covariance ของแต่ละ mass bin: C_α=(1−α)C+α·diag(C) และสแกน α ผลลัพธ์แสดงว่าความได้เปรียบของตระกูล EFT ไม่ไวต่อการจัดการแบบนี้

รูป R4 | ช่วงของ ΔlogL_total ภายใต้การสแกน cov-shrink (ยิ่งสูงยิ่งดี)
6.4 บันไดการตัดองค์ประกอบ (Run-8)
ภายใน EFT_BIN เราทำ nested ablations: ตั้งแต่แบบจำลองขั้นต่ำ (ไม่มีพารามิเตอร์อิสระ) ไปจนถึงเวอร์ชันที่คงดีกรีอิสระจำนวนน้อย และสุดท้ายคือแบบจำลองสมบูรณ์ที่มีแอมพลิจูด 20 bins + สเกลระดับโลก AICc/BIC แสดงว่าข้อมูลต้องการแบบจำลอง EFT_BIN สมบูรณ์อย่างชัดเจน

รูป R5 | บันได ablation ของ EFT_BIN (AICc; ยิ่งต่ำยิ่งดี)
6.5 การพยากรณ์แบบกันไว้ทดสอบ (Run-9)
เรารันการทดสอบ leave-one-bin-out (LOO) เพิ่มเติม: ในบรรดา 4 GGL mass bins จะกันไว้ครั้งละหนึ่ง bin; ทำการอนุมานใหม่ด้วย bins ที่เหลือ (และ RC ทั้งหมด) แล้วประเมิน test log-likelihood บน bin ที่กันไว้ ตัวชี้วัดสรุปให้ไว้ในตารางเสริม Tab_R3_leave_one_bin_out (ผลิตภัณฑ์ Run-9; รูปแบบพาธไฟล์ระบุไว้ในรายการผลิตภัณฑ์สำคัญในหัวข้อ 8.2) ตระกูล EFT ยังคงเหนือกว่า DM_RAZOR อย่างชัดเจน แม้ในกรณีกันไว้ที่แย่ที่สุด

รูป R6 | LOO: การกระจาย log-likelihood สำหรับ bin ที่กันไว้ (จากผลิตภัณฑ์ Run-9)
6.6 ตัวควบคุมเชิงลบ: RC-bin Shuffle (Run-10)
Run-10 สุ่มจัดกลุ่ม RC bins 20 bin ใหม่เป็น 4×5 และคำนวณ closure ใหม่โดยคงโพสทีเรียร์ RC-only ไว้ไม่เปลี่ยน ผลลัพธ์แสดงว่าเมื่อเทียบกับการจับคู่เดิม การ shuffle ลดทั้งค่าเฉลี่ย closure logL_true และ ΔlogL_closure ลงอย่างมีนัยสำคัญ (ดูตาราง S1b และรูป R1) สนับสนุนการตีความได้ของสัญญาณปิดวงจรเพิ่มเติม

รูป R7 | ตัวควบคุมเชิงลบ: การ shuffle mapping ทำให้ค่าเฉลี่ย closure logL_true ลดลงชัดเจน (จากผลิตภัณฑ์ Run-10)
7 การสืบย้อนและการตรวจสอบความสอดคล้อง (Provenance)
ค่าตัวเลขทั้งหมดที่อ้างในบทความนี้สามารถสืบย้อนเป็นรายการ ๆ ได้ในตารางสรุปแบบ strict และบันทึกการตรวจสอบของคลังเผยแพร่ เพื่อให้เนื้อหาหลักอ่านง่ายขึ้น ห่วงโซ่ provenance เต็มรูปแบบ (รายการแท็ก ตารางตรวจสอบ รายการ checksum และวิธีตรวจยืนยัน) ถูกย้ายไปไว้ในภาคผนวก A
8 การทำซ้ำผลและคลัง Zenodo
ถ้อยแถลงความพร้อมของข้อมูลและโค้ด: ข้อมูลเส้นโค้งการหมุน SPARC และข้อมูลเลนส์ความโน้มถ่วงอ่อน KiDS-1000 ที่ใช้ในบทความนี้เป็นชุดข้อมูลสาธารณะ รายงานระดับเผยแพร่ถูกเก็บถาวรบน Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334) และแพ็กเกจทำซ้ำผลฉบับเต็มถูกเก็บถาวรบน Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286) ขั้นตอนดำเนินการอย่างละเอียด สภาพแวดล้อม dependency บัญชีรายการคลัง และข้อมูลตรวจ hash ให้ไว้ในภาคผนวก A; การออกแบบ แท็กการรัน และผลลัพธ์ของการทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน (P1A) ให้ไว้ในภาคผนวก B
ภายใต้ Concept DOI ของแพ็กเกจทำซ้ำผลฉบับเต็มเดียวกัน (https://doi.org/10.5281/zenodo.18526286) เราให้จุดเข้าใช้ที่ทำซ้ำได้สองชุดตามกรณีใช้งาน: • P1 (เนื้อหาหลัก) full_fit_runpack: ทำซ้ำการวิเคราะห์ RC-only / closure / joint และการสแกนความทนทานสำหรับ EFT เทียบกับ DM_RAZOR พร้อมสร้างสินทรัพย์เนื้อหาหลัก เช่น ตาราง S1a/S1b และรูป S3/S4; • P1A (ภาคผนวก B) full_fit_runpack: ทำซ้ำการทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน (SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD รวมถึงตัวควบคุม EFT_BIN) พร้อมสร้างตารางภาคผนวก B1 และรูป B1 ตาราง/รูปเสริมและ full_fit_runpack ของ P1A จะถูกรวมเป็นไฟล์เพิ่มเติมภายใต้ Concept DOI เดียวกัน เพื่อรักษาจุดเข้าคลังเพียงจุดเดียว
9 คำขอบคุณและถ้อยแถลง
9.1 คำขอบคุณ
เราขอขอบคุณทีม SPARC และ KiDS-1000 ที่ให้ข้อมูลและเอกสารสาธารณะ และขอบคุณผู้เข้าร่วมเวิร์กโฟลว์การสร้างใหม่และการตรวจสอบของโครงการนี้
9.2 การมีส่วนร่วมของผู้เขียน
Guanglin Tu รับผิดชอบข้อเสนอแนวคิด การออกแบบการศึกษา การใช้งานเชิงวิศวกรรม การจัดการข้อมูล การวิเคราะห์เชิงรูปแบบ การใช้งานและตรวจสอบเวิร์กโฟลว์การทำซ้ำผล และการเขียนต้นฉบับ
9.3 ทุนสนับสนุน
ผู้เขียน Guanglin Tu สนับสนุนทุนด้วยตนเอง (ไม่มีทุนภายนอก / ไม่มีหมายเลขทุน)
9.4 ผลประโยชน์ทับซ้อน
ผู้เขียน Guanglin Tu สังกัด “คณะทำงาน EFT, Shenzhen Energy Filament Science Research Co., Ltd. (ประเทศจีน)”; ไม่มีการประกาศผลประโยชน์ทับซ้อนอื่น
9.5 ความช่วยเหลือจาก AI
OpenAI GPT-5.2 Pro และ Gemini 3 Pro ถูกใช้เพื่อขัดเกลาภาษา แก้ไขโครงสร้าง และจัดระเบียบเวิร์กโฟลว์การทำซ้ำผล ไม่ได้ใช้เพื่อสร้างหรือแก้ไขข้อมูล ผลลัพธ์ รูปภาพ ตาราง หรือโค้ด และไม่ได้ใช้เพื่อสร้างการอ้างอิง ผู้เขียนรับผิดชอบเนื้อหาและความถูกต้องของการอ้างอิงทั้งหมดของต้นฉบับแต่เพียงผู้เดียว
10 เอกสารอ้างอิง
- Lelli, F., McGaugh, S. S., & Schombert, J. M. (2016). SPARC: Mass Models for 175 Disk Galaxies with Spitzer Photometry and Accurate Rotation Curves. The Astronomical Journal, 152, 157. DOI: 10.3847/0004-6256/152/6/157.
- Brouwer, M. M., Oman, K. A., Valentijn, E. A., et al. (2021). The weak lensing radial acceleration relation: Constraining modified gravity and cold dark matter theories with KiDS-1000. Astronomy & Astrophysics, 650, A113. DOI: 10.1051/0004-6361/202040108.
- Wright, C. O., & Brainerd, T. G. (2000). Gravitational Lensing by Navarro–Frenk–White Halos. The Astrophysical Journal, 534, 34–40.
- Navarro, J. F., Frenk, C. S., & White, S. D. M. (1997). A Universal Density Profile from Hierarchical Clustering. Astrophysical Journal, 490, 493. DOI: https://doi.org/10.1086/304888
- Dutton, A. A., & Macciò, A. V. (2014). Cold dark matter haloes in the Planck era: evolution of structural parameters for NFW haloes. Monthly Notices of the Royal Astronomical Society, 441, 3359–3374. DOI: https://doi.org/10.1093/mnras/stu742
- Blumenthal, G. R., Faber, S. M., Flores, R., & Primack, J. R. (1986). Contraction of dark matter galactic halos due to baryonic infall. Astrophysical Journal, 301, 27. DOI: https://doi.org/10.1086/163867
- Di Cintio, A., Brook, C. B., Dutton, A. A., et al. (2014). A mass-dependent density profile for dark matter haloes including the influence of galaxy formation. Monthly Notices of the Royal Astronomical Society, 441, 2986–2995. DOI: https://doi.org/10.1093/mnras/stu729
- Read, J. I., Agertz, O., & Collins, M. L. M. (2016). Dark matter cores all the way down. Monthly Notices of the Royal Astronomical Society, 459, 2573–2590. DOI: https://doi.org/10.1093/mnras/stw713
- Energy Filament Theory. Zenodo (open science repository) DOI: https://doi.org/10.5281/zenodo.18517411
ภาคผนวก A: รายละเอียดการสืบย้อนและการทำซ้ำผล
ภาคผนวกนี้สรุปข้อมูลคลังระยะยาวเพื่อการสืบย้อนและการทำซ้ำผล รวมถึง run tags ผลการตรวจสอบ บัญชีรายการคลัง และจุดตรวจยืนยันสำคัญ เพื่อให้ผู้อ่านสามารถตรวจสอบและทำซ้ำงานได้ตามต้องการ
A.1 รายละเอียดการสืบย้อนและการตรวจสอบ
เพื่อให้สืบย้อนระยะยาวได้ โครงการนี้ใช้แท็กประทับเวลาสำหรับแต่ละการรันและผลลัพธ์ และเก็บผลิตภัณฑ์ย้อนหลังโดยไม่เขียนทับ ค่าหลักที่อ้างในต้นฉบับนี้มาจากการคอมไพล์แบบ strict (compile_tag=20260205_035929) และผ่านการตรวจสอบความสอดคล้องดังต่อไปนี้:
• ตารางระดับ stage ทั้งหมดมี run_tag และ stage tags; สคริปต์คอมไพล์แบบ strict เลือกแหล่งตาราง canonical ที่ “สมบูรณ์และสอดคล้อง” จาก report/tables
• ค่าใน Tab_Z1_master_summary และ Tab_Z2_conclusion_highlights ถูกเปรียบเทียบเป็นรายการ ๆ กับตาราง canonical ที่เลือก
• ระหว่างการสร้าง PDF มีการตรวจแท็กของ “แท็กตาราง/รูปที่ถูกอ้างถึง” เพื่อให้แน่ใจว่าไม่มีผลิตภัณฑ์ล้าสมัยปะปนอยู่
แท็กสำคัญ (สำหรับระบุตำแหน่งผลิตภัณฑ์กลางทั้งหมด): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442
ผลการตรวจสอบความสอดคล้อง: Tab_AUDIT_checks_strict รายงาน pass=9, fail=0, skip=0 (ดูรายละเอียดในแพ็กเกจเผยแพร่)
A.2 ขั้นตอนการทำซ้ำผลและบัญชีรายการคลัง
การศึกษานี้ใช้ระบบการทำซ้ำผลที่ประกอบด้วย “รายงานระดับเผยแพร่ + ส่วนเสริมตาราง/รูป + แพ็กเกจรันซ้ำได้เต็มรูปแบบ” ผู้อ่านสามารถดู Tables & Figures Supplement โดยตรงเพื่อตรวจยืนยันสินทรัพย์ตาราง/รูปทั้งหมดที่อ้างในบทความ หากต้องการทำซ้ำค่าตัวเลขและห่วงโซ่การตรวจสอบตั้งแต่ต้น สามารถใช้ full_fit_runpack เพื่อดาวน์โหลดข้อมูลและรันเวิร์กโฟลว์ทั้งหมดซ้ำ หลังเสร็จสิ้น สามารถใช้สคริปต์เปรียบเทียบตารางอ้างอิงในตัวของแพ็กเกจเพื่อตรวจยืนยันความสอดคล้องของค่าตาราง
A.2.1 จุดเริ่มต้นทำซ้ำผลแบบรวดเร็ว (RUN_FULL, Windows PowerShell)
หัวข้อนี้ให้เส้นทางทำซ้ำผลที่สั้นกว่า (Windows PowerShell) สำหรับการตรวจเร็ว ผู้อ่านควรดู Tables & Figures Supplement โดยตรงและตรวจตารางกับรูปที่อ้างเป็นรายการ ๆ สำหรับการทำซ้ำปลายทางถึงปลายทางและการสร้างตาราง รูป และผลิตภัณฑ์ตรวจสอบทั้งหมด ให้ใช้ full_fit_runpack: ทำตาม README/ONE_PAGE_REPRO_CHECKLIST ของแพ็กเกจเพื่อรัน verify_checksums.ps1 และ RUN_FULL.ps1 (แนะนำ Mode=full)
รายการคลัง Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286
แท็กสายหลักของบทความนี้: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442
A.2.2 วัสดุคลังและจุดตรวจยืนยันสำคัญ (Packages & checks)
คลัง Zenodo ให้หมวดวัสดุที่เสริมกันสามประเภท: (1) รายงานระดับเผยแพร่ (บทความนี้ v1.1; รวมภาคผนวก B: การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐานของ P1A); (2) Tables & Figures Supplement (ตารางและรูปเสริมที่ครอบคลุมสินทรัพย์ตาราง/รูปทั้งหมดที่อ้างในบทความนี้ แยกสอดคล้องกับ P1 และ P1A); และ (3) full_fit_runpack (แพ็กเกจทำซ้ำผลฉบับเต็ม: ดาวน์โหลดข้อมูลตั้งแต่ต้นและรันเวิร์กโฟลว์ทั้งหมดซ้ำ แยกสอดคล้องกับ P1 และ P1A) รายการ (1)–(2) สนับสนุนการอ่านเร็วและการตรวจยืนยันอิสระ ส่วนรายการ (3) ให้การทำซ้ำผลครบวงจรตั้งแต่ต้นจนจบ
หมวดวัสดุ | ชื่อไฟล์ (ตัวอย่าง) | วัตถุประสงค์และการวางตำแหน่ง (ลำดับใช้งานที่แนะนำ) |
รายงานระดับเผยแพร่ (จีนและอังกฤษ) | P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf | รายงานฉบับสมบูรณ์ที่เก็บถาวรบน Zenodo; เนื้อหาหลักให้ข้อสรุปแกนกลางและการตรวจสอบความทนทาน ส่วนภาคผนวก B ให้ P1A (การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน) |
Tables & Figures Supplement (P1) | P1_RC_GGL_supplement_figs_tables_V1_1.zip | ตารางทั้งหมด (CSV) และรูปทั้งหมด (PNG) ที่อ้างในเนื้อหาหลัก รวมถึงสคริปต์สร้างและไฟล์แท็ก |
Tables & Figures Supplement (P1A) | P1A_supplement_figs_tables_v1.zip | ตารางและรูปทั้งหมดที่อ้างในภาคผนวก B (P1A) รวมถึง Tab_S1_P1A_scoreboard และ Fig_S1_P1A_scoreboard |
full_fit_runpack (P1) | P1_RC_GGL_full_fit_runpack_v1_1.zip | การทำซ้ำผลเต็มรูปแบบแบบปลายทางถึงปลายทาง: ดาวน์โหลดข้อมูลตั้งแต่ต้นและรัน RC-only/closure/joint รวมถึงการสแกนความทนทานซ้ำ |
full_fit_runpack (P1A) | P1A_RC_GGL_full_fit_runpack_v1.zip | การทำซ้ำผลเต็มรูปแบบแบบปลายทางถึงปลายทาง (ภาคผนวก B): รัน DM 7+1 + DM_STD (รวมตัวควบคุม EFT_BIN) ซ้ำและสร้างสินทรัพย์ภาคผนวก; แพ็กเกจมีสคริปต์เปรียบเทียบตารางอ้างอิงเพื่อตรวจยืนยันความสอดคล้องของค่าตาราง |
ข้อเสนอแนะการอ้างอิง: เมื่ออ้างบทความนี้หรือวัสดุทำซ้ำผลประกอบ โปรดอ้าง Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334)
ผลิตภัณฑ์สำคัญที่ควรปรากฏและเปรียบเทียบได้หลังการทำซ้ำผล ได้แก่:
- report/tables/Tab_D_closure_summary__20260204_122515__*.csv (สรุป closure)
- report/tables/Tab_F_joint_summary__20260204_122515__*.csv (สรุปการฟิตร่วม)
- report/tables/Tab_G_joint_sigma_sweep__20260204_122515__*.csv (การสแกน σ_int)
- report/tables/Tab_H_joint_rmin_sweep__20260204_122515__*.csv (การสแกน R_min)
- report/tables/Tab_I_joint_covshrink_sweep__20260204_122515__*.csv (การสแกน cov-shrink)
- report/tables/Tab_R2_ablation_ladder__20260204_122515__*.csv (ablation)
- report/tables/Tab_R3_leave_one_bin_out__20260204_122515__*.csv (LOO)
- report/tables/Tab_R4_negctrl_rcbin_shuffle__20260204_122515__*.csv (ตัวควบคุมเชิงลบ)
- report/final/Tab_Z1_master_summary__20260204_122515__20260205_035929.csv (ตาราง master แบบ Strict; สอดคล้องกับตาราง S1a/S1b และค่าหลักในเนื้อหา)
- report/final/P1_RC_GGL_final_bundle__20260204_122515__20260205_035929.pdf (บันเดิล PDF ระดับเผยแพร่; ใช้สำหรับดูเร็วและอ้างอิงได้)
ภาคผนวก B: P1A—การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน (DM 7+1 + DM_STD; มีตัวควบคุม EFT)
ภาคผนวกนี้บันทึกโครงการขยาย (P1A) สำหรับ “การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน” ซึ่งสอดคล้องกับโปรโตคอลปิดวงจรในเนื้อหาหลัก บทบาทของมันคือยกระดับเส้นฐาน DM_RAZOR ขั้นต่ำที่ใช้ในเนื้อหาหลัก (NFW + c–M คงที่, ไม่มี scatter / ไม่มี contraction / ไม่มี core) ให้เป็นชุดเส้นฐาน DM ที่ใกล้กับการปฏิบัติทางดาราศาสตร์ฟิสิกส์และทนต่อข้อวิจารณ์ทั่วไปมากขึ้น โดยไม่เพิ่มดีกรีอิสระจำนวนมาก และไม่เปลี่ยนการจับคู่ร่วม RC-bin→GGL-bin หรือกรอบการตรวจสอบ P1A ครอบคลุมและเป็น superset ของการทดสอบแรงกดดันสามกิ่งก่อนหน้า: คง SCAT/AC/FB ไว้ พร้อมเพิ่ม hierarchical c–M scatter + prior, core proxy หนึ่งพารามิเตอร์ และ nuisance m ของ shear-calibration ฝั่งเลนส์; ยังให้แบบจำลองรวม DM_STD อีกด้วย EFT_BIN ถูกคงไว้เป็นอ้างอิงควบคุม
หมายเหตุเสริม: ความแรงการปิดวงจรและค่าที่เกี่ยวข้องในภาคผนวก B (P1A) ใช้งบ Monte Carlo ที่มากกว่า (เช่น ndraw=400, nperm=24) งบ quick ที่ใช้ในเนื้อหาหลักเพื่อครอบคลุมตระกูลเคอร์เนล EFT ทั้งหมด (เช่น ndraw=60, nperm=12) ดังนั้นค่าตัวเลขสัมบูรณ์อาจมี drift จากการสุ่มระดับ O(10) อย่างไรก็ตาม การเปรียบเทียบระหว่างแบบจำลองภายในงบ/ตารางเดียวกันเป็นธรรม และเครื่องหมายกับขนาดของความได้เปรียบยังคงเสถียรข้ามงบ
B.1 วัตถุประสงค์และการวางตำแหน่ง (ทำไมต้อง P1A และทำไมอยู่ในภาคผนวก)
P1A ไม่พยายามไล่ให้หมดทุกตัวเลือกการสร้างแบบจำลองฮาโล ΛCDM (เช่น ความไม่ทรงกลม การพึ่งพาสิ่งแวดล้อม การเชื่อมต่อดาราจักร–ฮาโลที่ซับซ้อน หรือ baryon physics มิติสูง) แต่ P1A ทำตามหลัก “มิติต่ำ ตรวจสอบได้ ทำซ้ำได้”: โมดูลเสริมแต่ละชุดเพิ่มเพียงพารามิเตอร์มีผลสำคัญ ≤1 ตัว และยังอยู่ภายใต้ข้อจำกัดแข็งสามข้อของบทความนี้:
(i) บัญชีพารามิเตอร์: พารามิเตอร์ใหม่ทุกตัวต้องถูกบันทึกอย่างชัดเจนและรายงานพร้อมเกณฑ์สารสนเทศ (AICc/BIC);
(ii) การจับคู่ร่วม: ยังคงใช้แผนที่การจัดกลุ่ม RC-bin→GGL-bin เดิม; ไม่อนุญาตให้ “ปรับการจับคู่” แยกเฉพาะชุดข้อมูลเดียว;
(iii) การทดสอบปิดวงจร: การเสริมใด ๆ ต้องแสดงกำไรจริงในการพยากรณ์ถ่ายโอน RC→GGL ไม่ใช่เพียงฟิต RC-only ได้ดีขึ้น
B.2 DM 7+1 + DM_STD: นิยามโมดูล พารามิเตอร์ และการเข้าสู่โพสทีเรียร์ร่วม
ในฐานะ runpack อิสระ P1A ให้ DM workspaces 8 ชุด (DM 7+1) พร้อมตัวควบคุม EFT 1 ชุด: เริ่มจาก DM_RAZOR เป็นเส้นฐาน สร้างการเสริม legacy หนึ่งพารามิเตอร์สามรายการ (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), เพิ่มโมดูลป้องกันที่เป็นมาตรฐานขึ้นสามรายการ (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) แล้วให้แบบจำลองรวม DM_STD เป้าหมายร่วมของโมดูลเหล่านี้คือครอบคลุมข้อวิจารณ์ที่พบบ่อยที่สุดสามประเภท พร้อมเพิ่มมิติให้น้อยที่สุด: (a) c–M scatter และ priors เข้าสู่แบบจำลองลำดับชั้นอย่างไร; (b) ผลหลักของ baryonic feedback สามารถจับด้วย core proxy หนึ่งพารามิเตอร์ได้หรือไม่; และ (c) ระบบผิดพลาดสำคัญฝั่งเลนส์อาจถูกเข้าใจผิดว่าเป็นสัญญาณฟิสิกส์ได้หรือไม่
Workspace | dm_model | พารามิเตอร์ใหม่ (≤1) | แรงจูงใจทางฟิสิกส์ (แกนกลาง) | หลักการใช้งาน (เป็นมิตรต่อการตรวจสอบ) |
|---|---|---|---|---|
DM_RAZOR | NFW (fixed c–M, no scatter) | — | เส้นฐานฮาโล ΛCDM ขั้นต่ำที่ตรวจสอบได้; ใช้สำหรับเปรียบเทียบอย่างเข้มงวดกับ EFT | ตรึงการจับคู่ร่วม; บัญชีพารามิเตอร์เข้มงวด; ใช้เป็น baseline สำหรับการเปรียบเทียบสัมพัทธ์เท่านั้น |
DM_RAZOR_SCAT | NFW + c–M scatter(legacy) | σ_logc | ความสัมพันธ์ c–M มี scatter; ประมาณด้วย log-normal scatter หนึ่งพารามิเตอร์ | ≤1 พารามิเตอร์ใหม่; คงการจับคู่ร่วม; ใช้กำไรด้าน closure เป็นเกณฑ์ยอมรับ |
DM_RAZOR_AC | NFW + Adiabatic Contraction(legacy) | α_AC | การตกเข้าของ baryon อาจทำให้ฮาโลหดตัวแบบ adiabatic; ประมาณด้วยความแรงหนึ่งพารามิเตอร์ | ≤1 พารามิเตอร์ใหม่; การจับคู่ไม่เปลี่ยน; รายงานการเปลี่ยน AICc/BIC และกำไรด้าน closure |
DM_RAZOR_FB | NFW + feedback core(legacy) | log r_core | feedback อาจสร้าง core ในบริเวณด้านใน; ประมาณด้วยสเกล core หนึ่งพารามิเตอร์ | ≤1 พารามิเตอร์ใหม่; ใช้โปรโตคอล closure/ตัวควบคุมเชิงลบเดียวกัน; การปรับปรุง RC-only ไม่ใช่เป้าหมายเดียว |
DM_HIER_CMSCAT | Hierarchical c–M scatter + prior | σ_logc(hier) | โครงสร้างลำดับชั้น c_i∼logN(c(M_i),σ_logc) ที่เป็นมาตรฐานกว่า; ส่งผลต่อโพสทีเรียร์ร่วมของทั้ง RC และ GGL | แสดง prior ชัดเจน; marginalize latent c_i; ยังมิติต่ำและตรวจสอบได้ |
DM_CORE1P | 1‑parameter core proxy (coreNFW/DC14‑inspired) | log r_core | ใช้ core proxy หนึ่งพารามิเตอร์สำหรับผลหลักของ baryonic feedback เพื่อหลีกเลี่ยงรายละเอียดการก่อดาวมิติสูง | อ้างวรรณกรรมมาตรฐาน; ≤1 พารามิเตอร์ใหม่; ผูกกับการทดสอบ closure |
DM_RAZOR_M | NFW + lensing shear‑calibration nuisance | m_shear(GGL) | ดูดซับระบบผิดพลาดสำคัญของเลนส์ความโน้มถ่วงอ่อนด้วยพารามิเตอร์มีผลหนึ่งตัว ลดความเสี่ยงในการเข้าใจระบบผิดพลาดผิดว่าเป็นฟิสิกส์ | บันทึก nuisance อย่างชัดเจน; ไม่สามารถส่งผลย้อนกลับต่อ RC; ตัดสินผลลัพธ์หลักจากความทนทานของ closure |
DM_STD | Standardized DM baseline (HIER_CMSCAT + CORE1P + m) | σ_logc + log r_core (+ m_shear) | รวมข้อวิจารณ์ที่พบบ่อยที่สุดสามกลุ่มไว้ในเส้นฐานมาตรฐานที่ยังมีมิติต่ำ | รายงานบัญชีพารามิเตอร์ + เกณฑ์สารสนเทศ; closure เป็นตัวชี้วัดหลัก; ใช้เป็นตัวควบคุมป้องกัน DM ที่แข็งแรงที่สุด |
หมายเหตุ: ชื่อพารามิเตอร์ข้างต้นตามการใช้งานเชิงวิศวกรรม (เช่น σ_logc, α_AC, log r_core และ m_shear) จุดเน้นของการออกแบบ P1A คือ “ทำให้เส้นฐาน DM แข็งแรงขึ้นบ้างพร้อมยังตรวจสอบได้” ไม่ใช่เปลี่ยนฝั่ง DM ให้เป็นเครื่องฟิตมิติสูงที่ควบคุมไม่ได้ โดยเฉพาะ DM_HIER_CMSCAT ใส่ c–M scatter แบบลำดับชั้น: กำหนดความเข้มข้น c_i ของฮาโลแต่ละตัวให้มี scatter แบบ log-normal รอบ c(M_i) และถูกจำกัดด้วย σ_logc ระดับโลกและ c(M) prior; โครงสร้างลำดับชั้นนี้ส่งผลต่อโพสทีเรียร์ร่วมของทั้ง RC และ GGL
B.3 โปรโตคอลสถิติและแบบแผนผลิตภัณฑ์ที่สอดคล้องกับเนื้อหาหลัก
P1A ใช้ผลิตภัณฑ์ข้อมูลทั้งหมด การจับคู่ร่วม และกรอบการตรวจสอบจากเนื้อหาหลักซ้ำ ลำดับการดำเนินงานและแบบแผนผลิตภัณฑ์ยังคงสอดคล้องกัน:
(1) Run‑1: การอนุมาน RC-only (ส่งออก posterior_samples.npz และ metrics.json);
(2) Run‑2: การทดสอบปิดวงจร RC→GGL (ส่งออก closure_summary.json และ permuted baseline);
(3) Run‑3: การฟิตร่วม RC+GGL (ส่งออก joint_summary.json)
ค่าตัวเลขทั้งหมดที่อ้างมาจากตารางที่คอมไพล์อัตโนมัติ (Tab_S1_P1A_scoreboard) และสามารถตรวจได้หลังรันเวิร์กโฟลว์ P1A เต็มรูปแบบซ้ำ โดยใช้สคริปต์เปรียบเทียบตารางอ้างอิงที่ฝังอยู่ใน P1A full_fit_runpack
B.4 ผลลัพธ์หลัก จุดเข้าตาราง/รูป และแผนคลัง (DOI เดียวกัน)
หัวข้อนี้ให้ข้อสรุปเชิงปริมาณแกนกลางของ P1A ตาราง B1 สรุปตัวชี้วัดสำคัญสำหรับ RC-only, RC→GGL closure และการฟิตร่วม RC+GGL (วงเล็บแสดงความต่างเมื่อเทียบกับเส้นฐาน DM_RAZOR) ความแรงการปิดวงจรถูกนิยามเป็น ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (ยิ่งสูงยิ่งดี) รูป B1 แสดง scoreboard เดียวกันเป็นภาพ ประเด็นหลักมีดังนี้:
• ในสามกิ่ง legacy มีเพียง DM_RAZOR_FB (feedback/core) ที่ให้การปรับปรุงสุทธิเล็กน้อยในความแรงการปิดวงจร: 122.21→129.45 (+7.25); SCAT และ AC ไม่ให้การปรับปรุงสุทธิ;
• DM_HIER_CMSCAT และ DM_RAZOR_M ที่เพิ่มใหม่มีผลเล็กมาก (~0) ต่อความแรงการปิดวงจร และ DM_CORE1P ก็ไม่แสดงการปรับปรุงสุทธิอย่างมีนัยสำคัญเช่นกัน;
• แบบจำลองรวม DM_STD สามารถปรับปรุง joint logL ได้มาก (เข้าใกล้ optimum ของการฟิตร่วมมากขึ้น) แต่ความแรงการปิดวงจรลดลง บ่งชี้ว่ากำไรหลักมาจากความยืดหยุ่นในการฟิตร่วมมากกว่าการถ่ายโอนข้ามโพรบ;
• ในฐานะตัวควบคุม EFT_BIN ยังรักษาความได้เปรียบชัดเจนทั้งด้านความแรงการปิดวงจรและการฟิตร่วม ดังนั้นข้อสรุปหลักจึงทนทานต่อการนำ “เส้นฐาน DM ที่แข็งแรงขึ้น + nuisance ฝั่งเลนส์” เข้ามา
เพื่อเปรียบเทียบโดยตรงกับผลลัพธ์ในเนื้อหาหลัก ตาราง S1a–S1b สรุปการเปรียบเทียบแบบ strict ระหว่างตระกูล EFT กับ DM_RAZOR: แบบจำลอง EFT ปรับปรุงการฟิตร่วมด้วย ΔlogL_total≈1155–1337 เมื่อเทียบกับ DM_RAZOR และถึง ΔlogL_closure=172–281 ในการทดสอบปิดวงจร P1A เพียงสร้าง “ตัวควบคุมที่ยากขึ้น” ฝั่ง DM; จุดประสงค์คือเพื่อลดข้อกังวลเช่น “เส้นฐานหุ่นฟาง” หรือ “ระบบผิดพลาดถูกถือเป็นฟิสิกส์” ไม่ใช่เพื่อแทนที่การเปรียบเทียบหลัก
ตาราง B1 | scoreboard ของ P1A (ยิ่งสูงยิ่งดี; วงเล็บแสดงความต่างเมื่อเทียบกับเส้นฐาน DM_RAZOR)
กิ่งแบบจำลอง (workspace) | Δk | RC-only best logL_RC (Δ) | ความแรง closure ΔlogL_closure (Δ) | Joint best logL_total (Δ) |
DM_RAZOR | 0 | -15702.654 (+0.000) | 122.205 (+0.000) | -27347.068 (+0.000) |
DM_RAZOR_SCAT | 1 | -15702.294 (+0.361) | 121.236 (-0.969) | -23153.311 (+4193.758) |
DM_RAZOR_AC | 1 | -15703.689 (-1.035) | 121.531 (-0.674) | -23982.557 (+3364.511) |
DM_RAZOR_FB | 1 | -15496.046 (+206.609) | 129.454 (+7.249) | -27478.531 (-131.463) |
DM_HIER_CMSCAT | 1 | -15702.644 (+0.010) | 121.978 (-0.227) | -23153.160 (+4193.908) |
DM_CORE1P | 1 | -15723.158 (-20.504) | 122.056 (-0.149) | -27336.258 (+10.810) |
DM_RAZOR_M | 0 (+m) | -15702.654 (+0.000) | 122.205 (+0.000) | -27340.451 (+6.617) |
DM_STD | 2 (+m) | -15832.203 (-129.549) | 105.690 (-16.515) | -22984.445 (+4362.623) |
EFT_BIN | 1 | -14631.537 (+1071.117) | 204.620 (+82.415) | -19001.142 (+8345.926) |
รูป B1 | scoreboard ของ P1A: closure และ joint ΔlogL เมื่อเทียบกับ baseline (ยิ่งสูงยิ่งดี)

แท็กตัวอย่างสำหรับชุดการรันที่เสร็จสมบูรณ์ซึ่งสอดคล้องกับภาคผนวกนี้มีดังนี้ (ใช้ระบุตำแหน่งผลิตภัณฑ์กลางและตาราง/รูปของ P1A):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428
B.5 ข้อเสนอแนะการอ้างอิง (หมายเหตุการอ้างอิงภาคผนวก)
เมื่อผู้อ่านต้องการอ้าง “การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน” เพิ่มจากข้อสรุปหลักของบทความ แนะนำให้อ้างข้อสรุปหลักพร้อมหมายเหตุว่า: “See Appendix B (P1A) for standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.”