← การทดลอง

P1_RC_GGL: การทดสอบปิดวงจรอย่างเข้มงวดของพลวัตดาราจักรและเลนส์ความโน้มถ่วงอ่อน (เส้นโค้งการหมุน + GGL)

กรอบแรงโน้มถ่วงเฉลี่ยของ EFT เทียบกับเส้นฐาน NFW ขั้นต่ำสำหรับสสารมืดเย็น (DM)

ผู้เขียน: Guanglin Tu
อีเมล: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
สังกัด: คณะทำงาน EFT, Shenzhen Energy Filament Science Research Co., Ltd. (ประเทศจีน)
เวอร์ชัน: v1.1 | วันที่: 2026-02-14

ต้นฉบับก่อนพิมพ์ (ยังไม่ผ่านการประเมินโดยผู้ทรงคุณวุฒิ) | เวอร์ชันนี้จัดทำขึ้นเพื่อการเผยแพร่สาธารณะและการทำซ้ำผล ไม่ใช่เวอร์ชันสุดท้ายที่ตีพิมพ์ในวารสาร

สัญญาอนุญาต: รายงาน (CC BY-NC-ND 4.0); แพ็กเกจทำซ้ำผลฉบับเต็ม (CC BY 4.0)

รายงานระดับเผยแพร่ (Concept DOI): https://doi.org/10.5281/zenodo.18526334 แพ็กเกจทำซ้ำผลฉบับเต็ม (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 บทสรุปสำหรับผู้บริหาร

รายงานฉบับนี้เป็นฉบับเก็บถาวรระดับเผยแพร่ที่ฝากไว้บน Zenodo โดยให้ห่วงโซ่ที่ตรวจสอบได้แบบบูรณาการ ครอบคลุมข้อมูล บัญชีแบบจำลอง การเปรียบเทียบอย่างเป็นธรรม การทดสอบปิดวงจร และวัสดุสำหรับการทำซ้ำผล ภาคผนวก B (P1A) ทำหน้าที่เป็นส่วนเสริมด้านความทนทาน โดยมุ่งเน้นการทดสอบแรงกดดันด้วย “เส้นฐาน DM ที่เป็นมาตรฐานมากขึ้น + ระบบผิดพลาดด้านเลนส์ที่สำคัญหนึ่งรายการ” เพื่อประเมินความไวของข้อสรุปหลักต่อการสร้างแบบจำลอง DM ที่สมจริงยิ่งขึ้นและการจัดการระบบผิดพลาดของเลนส์

ข้อสรุปหลัก (สี่ประโยคที่อ้างอิงได้โดยตรง; ดูหัวข้อ 2.4):

(1) ในการฟิตเส้นโค้งการหมุน (RC) ตระกูลแบบจำลอง EFT เหนือกว่า DM_RAZOR อย่างมีนัยสำคัญภายใต้ชุดเคอร์เนล/ไพรเออร์ทุกแบบ; ค่าปรับปรุงโดยทั่วไปคือ Δlog𝓛_RC ≈ 10^3 (ดูตาราง S1a)
(2) ในการทดสอบปิดวงจร RC→GGL, EFT แสดงความสามารถในการถ่ายโอนข้ามโพรบที่แข็งแรงกว่า: ความแรงของการปิดวงจร Δlog𝓛_closure (True−Perm) สูงกว่า DM_RAZOR อย่างมีนัยสำคัญ และความแตกต่างนี้ทนทานต่อการสแกน covariance shrinkage, R_min และ σ_int (ดูรูป S3 และตาราง S1b)
(3) ในการฟิตร่วม (RC+GGL), EFT ยังรักษาความได้เปรียบอย่างเสถียร; เมื่อใช้ตัวควบคุมเชิงลบที่ทำลายการจับคู่ร่วม ความได้เปรียบนี้ยุบตัวลง สนับสนุนการตีความว่า “ผลแรงโน้มถ่วงเฉลี่ย” มาจากการจับคู่ร่วม ไม่ใช่การฟิตโดยบังเอิญ (ดูรูป S4)
(4) ภาคผนวก B (P1A) ทดสอบแรงกดดันด้าน DM ด้วยโมดูลเส้นฐาน DM ที่เป็นมาตรฐานมากขึ้นและ nuisance ของระบบเลนส์ที่สำคัญหนึ่งรายการ โดยไม่เพิ่มมิติอย่างมีนัยสำคัญ การเสริมเหล่านี้ไม่ได้ลบความได้เปรียบด้านการปิดวงจรของ EFT (ดูตาราง B1 และรูป B1)

ความพร้อมของข้อมูลและโค้ด: รายงาน Concept DOI 10.5281/zenodo.18526334; แพ็กเกจทำซ้ำผลฉบับเต็ม Concept DOI 10.5281/zenodo.18526286 แท็กที่สอดคล้องกับภาคผนวก B (P1A) คือ run_tag=20260213_151233, closure_tag=20260213_161731 และ joint_tag=20260213_195428

1 บทคัดย่อ

เราดำเนินการเปรียบเทียบเชิงปริมาณที่ทำซ้ำได้ระหว่างกรอบทฤษฎีสองชุด ภายใต้ข้อมูลเดียวกันและโปรโตคอลสถิติเดียวกัน ได้แก่ แบบจำลอง “การแก้ไขแรงโน้มถ่วงเฉลี่ย” ที่เสนอโดยทฤษฎีเส้นใยพลังงาน (Energy Filament Theory, EFT; แตกต่างจากคำย่อทั่วไปของ effective field theory) และแบบจำลองเส้นฐานฮาโล NFW ของสสารมืดเย็น (DM_RAZOR) ทั้งนี้ DM_RAZOR ถูกเลือกโดยเจตนาให้เป็น “เส้นฐาน DM ขั้นต่ำ”: ฮาโล NFW ที่มีความสัมพันธ์ c–M คงที่ (ไม่มี halo-to-halo scatter) เพื่อทำหน้าที่เป็นตัวควบคุมที่ตรวจสอบและทำซ้ำได้ ควรเน้นด้วยว่าบทความนี้ปฏิบัติต่อ EFT ในฐานะพารามิเตอร์ไรเซชันเชิงปรากฏการณ์แบบ MOND-like ของสนามมีผล/การตอบสนองมีผล สำหรับการทดสอบภายใต้โปรโตคอลสถิติแบบรวม ไม่ใช่การอนุมานหลักการจุลภาคลำดับแรกภายในงานนี้

ข้อมูลประกอบด้วยจุดข้อมูลความเร็ว 2,295 จุดจากเส้นโค้งการหมุน SPARC (RC) ซึ่งผ่านการเตรียมข้อมูลและแบ่ง bin อย่างเป็นระบบ (104 ดาราจักร, 20 RC bins) ร่วมกับความหนาแน่นผิวส่วนเกิน ΔΣ(R) จากเลนส์ความโน้มถ่วงอ่อนระหว่างดาราจักร KiDS-1000 (GGL) (4 bin มวลดาว × 15 จุด R ต่อ bin รวม 60 จุด โดยใช้ covariance เต็มรูปแบบ)

เราดำเนินการตามลำดับ ได้แก่ การอนุมานแบบ RC-only, การทดสอบปิดวงจร RC→GGL, การอนุมานแบบ GGL-only และการอนุมานร่วม RC+GGL พร้อมใช้การตรวจสอบความสอดคล้องเพื่อให้แน่ใจว่าค่าตัวเลขทุกค่าที่อ้างถึงสามารถสืบย้อนกลับได้ ภายใต้บัญชีพารามิเตอร์ที่เข้มงวดและข้อจำกัดการจับคู่ร่วม (DM: พารามิเตอร์ log M200_bin จำนวน 20 ตัว; EFT: พารามิเตอร์ log V0_bin จำนวน 20 ตัว + log ℓ ระดับโลก 1 ตัว) ตระกูล EFT เหนือกว่า DM_RAZOR อย่างมีนัยสำคัญในการฟิตร่วม: ΔlogL_total = 1155–1337 เมื่อเทียบกับ DM_RAZOR ที่สำคัญกว่านั้น การทดสอบปิดวงจรแสดงว่าโพสทีเรียร์ของ RC มีพลังพยากรณ์ต่อ GGL ที่ไม่ใช่เรื่องเล็กน้อย: ความแรงการปิดวงจรของ EFT คือ ΔlogL_closure = 172–281 สูงกว่า 127 ของ DM_RAZOR เมื่อสุ่มสลับการจัดกลุ่ม RC-bin→GGL-bin สัญญาณการปิดวงจรยุบลงเหลือ 6–23 ยืนยันว่าสัญญาณนี้ไม่ใช่เหตุบังเอิญทางสถิติหรืออาร์ติแฟกต์จากการใช้งาน ในการสแกนระบบตาม σ_int, R_min และ covariance shrinkage ความได้เปรียบสัมพัทธ์ของ EFT ยังคงเป็นบวกและมีขนาดเสถียร เพื่อจัดการข้อกังวลทั่วไปว่า “เส้นฐาน DM อ่อนเกินไป” หรือ “ระบบผิดพลาดถูกเข้าใจผิดว่าเป็นฟิสิกส์” ภาคผนวก B (P1A) จึงให้การทดสอบแรงกดดันของเส้นฐาน DM ที่เป็นมาตรฐานกว่าแต่ยังมีมิติต่ำและตรวจสอบได้ รวมถึง hierarchical c–M scatter + prior, core proxy หนึ่งพารามิเตอร์, lensing m และแบบจำลองรวม DM_STD ภายใต้โปรโตคอลปิดวงจรเดียวกัน การเสริมเหล่านี้ไม่ได้ลบความได้เปรียบด้านการปิดวงจรของ EFT (ดูตาราง B1/รูป B1)

คำสำคัญ: เส้นโค้งการหมุน; เลนส์ความโน้มถ่วงอ่อนระหว่างดาราจักร; การทดสอบปิดวงจร; EFT; สสารมืดเย็น; การอนุมานแบบเบย์

2 บทนำและภาพรวมผลลัพธ์

เส้นโค้งการหมุน (RC) และเลนส์ความโน้มถ่วงอ่อนระหว่างดาราจักร (GGL) เป็นโพรบแรงโน้มถ่วงสองชนิดที่เสริมกัน: RC จำกัดศักย์พลวัตและความสัมพันธ์ความเร่งแนวรัศมี (RAR) ในระนาบจาน ส่วน GGL วัดการกระจายมวลแบบฉายและการตอบสนองแรงโน้มถ่วงในสเกลฮาโล สำหรับทฤษฎีผู้สมัครใด ๆ คำถามสำคัญไม่ใช่ว่ามันสามารถฟิตชุดข้อมูลสองชุดแยกกันได้หรือไม่ แต่คือมันสามารถอธิบายทั้งสองอย่างสอดคล้องกันภายใต้การจับคู่ข้ามข้อมูลและข้อจำกัดร่วมเดียวกันได้หรือไม่

ดังนั้น บทความนี้ใช้ “การทดสอบปิดวงจร” เป็นโปรโตคอลสถิติแกนกลาง: ขั้นแรกใช้โพสทีเรียร์แบบ RC-only เพื่อพยากรณ์ GGL ไปข้างหน้า จากนั้นเปรียบเทียบกับตัวควบคุมเชิงลบที่ทำการ permute/shuffle การจับคู่ RC-bin→GGL-bin ขั้นตอนนี้ประเมินความสามารถในการถ่ายโอนพยากรณ์ข้ามข้อมูลและตัดสัญญาณเทียมที่เกิดจากอคติในการใช้งานหรือการฟิตโดยบังเอิญออกไป

การวางตำแหน่งและขอบเขตทางทฤษฎี: บทความนี้ไม่ได้พยายามนำเสนอการอนุมานหลักการจุลภาคลำดับแรกของ EFT (ทฤษฎีเส้นใยพลังงาน) หรือสูตรที่สมบูรณ์เชิงสัมพัทธภาพ ในทางกลับกัน เราปฏิบัติต่อ EFT เป็นพารามิเตอร์ไรเซชันมิติต่ำแบบ MOND-like ของสนามมีผล/การตอบสนองมีผล (อธิบายด้วยเคอร์เนล f(x) และสเกลระดับโลก ℓ) และทดสอบความสอดคล้องข้ามข้อมูลกับพลังพยากรณ์ในการถ่ายโอนผ่านการทดสอบปิดวงจร RC→GGL ภายใต้บัญชีพารามิเตอร์ที่เข้มงวด

ถ้อยแถลงว่าด้วยโครงการวิจัยและขอบเขต: บทความนี้เป็นส่วนหนึ่งของโครงการสืบค้นเชิงสังเกตการณ์ชุด P ที่กำลังดำเนินต่อไป ในข้อมูลสเกลดาราจักรที่มีอยู่ เราค้นหาการมีส่วนร่วมพื้นหลังมีผลที่เป็นไปได้สองชนิด: (i) “ฐานแรงโน้มถ่วงเฉลี่ย” ที่อธิบายได้ด้วยการตอบสนองแรงโน้มถ่วงเฉลี่ยหลัง coarse-graining และ (ii) “ฐานสุ่ม/ฐานเสียงรบกวน” ที่เกี่ยวข้องกับความผันผวนของกระบวนการจุลภาค ในบทความนี้ (P1) เรามุ่งเฉพาะชนิดแรก: โดยไม่แนะนำสมมติฐานใด ๆ เกี่ยวกับกลไกการเกิดระดับจุลภาค เราใช้การทดสอบปิดวงจร RC→GGL เพื่อสืบค้นร่องรอยเชิงสังเกตของฐานแรงโน้มถ่วงเฉลี่ยและเปรียบเทียบกับเส้นฐาน DM ที่ตรวจสอบได้ภายใต้โปรโตคอลควบคุมแบบรวม ในฐานะภาพทางฟิสิกส์เชิงชี้นำ หากมีดีกรีอิสระอายุสั้นอยู่จริง การสลาย/การทำลายล้างของมันสามารถแปลงมวลนิ่งเป็นพลังงาน-โมเมนตัมที่ดีกรีอิสระอื่นพาไป ซึ่งสอดคล้องตามธรรมชาติในระดับมีผลกับการแยก “ส่วนเฉลี่ย + ส่วนผันผวน”; อย่างไรก็ตาม บทความนี้ไม่ได้สร้างแบบจำลองเชิงปริมาณให้ภาพจุลภาคดังกล่าว

เพื่อหลีกเลี่ยงการตีความเกินขอบเขต ขอบเขตของบทความนี้เป็นดังนี้:
• สิ่งที่บทความนี้ทำ: ภายใต้ข้อจำกัดบัญชีพารามิเตอร์และการจับคู่ร่วมที่เข้มงวด ใช้การทดสอบปิดวงจรเพื่อวัดความสามารถในการถ่ายโอนพยากรณ์ข้ามข้อมูล และทำการเปรียบเทียบที่ทำซ้ำได้ระหว่างการตอบสนองแรงโน้มถ่วงเฉลี่ยของ EFT กับเส้นฐาน DM
• สิ่งที่บทความนี้ไม่ทำ: ไม่อภิปรายกลไกการเกิดระดับจุลภาค ความอุดมสมบูรณ์/อายุขัย หรือข้อจำกัดจักรวาลวิทยา; ไม่สร้างแบบจำลองเทอมสุ่มที่สอดคล้องกับ “ฐานเสียงรบกวน”
• สิ่งที่บทความนี้ไม่ได้อ้าง: ไม่มุ่งล้มล้างสสารมืด; P1 ไม่ให้คำตัดสินสุดท้ายว่า “ฐาน” มีอยู่หรือไม่ แต่รายงานหลักฐานระดับระยะว่า ภายในโดเมนการวัดที่แข็งแรงซึ่งเลือกไว้ในที่นี้ ข้อมูลโน้มเอียงไปยังแบบจำลองที่มีการตอบสนองแรงโน้มถ่วงเฉลี่ย

ขณะเดียวกัน เราชี้แจงว่า DM_RAZOR เป็นเพียงเส้นฐาน NFW ขั้นต่ำที่ตรวจสอบได้ (c–M คงที่และไม่มี scatter; ไม่มี adiabatic contraction, feedback core, ความไม่ทรงกลม หรือเทอมสิ่งแวดล้อม) ดังนั้น ข้อสรุปหลักของเนื้อหาหลักจึงจำกัดอย่างเข้มงวดอยู่ที่ถ้อยคำนี้: ภายใต้เส้นฐานขั้นต่ำและข้อจำกัดบัญชีพารามิเตอร์/การจับคู่ที่เข้มงวด EFT แสดงความสอดคล้องข้ามข้อมูลที่แข็งแรงกว่า เพื่อจัดการคำถามทั่วไปว่าเส้นฐาน ΛCDM ที่เป็นมาตรฐานมากกว่าและการสร้างแบบจำลองระบบผิดพลาดด้านเลนส์ที่สำคัญจะเปลี่ยนข้อสรุปอย่างมีนัยสำคัญหรือไม่ เราจึงรวบรวมการเสริม DM ที่เป็นมาตรฐานขึ้นแต่ยังมีมิติต่ำและตรวจสอบได้ พร้อม nuisance ฝั่งเลนส์ไว้ในภาคผนวก B (P1A: การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน) โดยคงการจับคู่ร่วมและโปรโตคอลทดสอบปิดวงจรเหมือนกับเนื้อหาหลักทุกประการ (ดูตาราง B1/รูป B1)

2.1 ตาราง S1a–S1b: สรุปตัวชี้วัดหลัก (Strict)

ตาราง S1a รายงานตัวชี้วัดเปรียบเทียบหลักสำหรับการฟิตร่วม (RC+GGL): logL, ΔlogL, AICc และ BIC ตาราง S1b รายงานตัวชี้วัดของการทดสอบปิดวงจรและการสแกนความทนทาน ได้แก่ closure, ตัวควบคุมเชิงลบแบบ shuffle และช่วงสแกน σ_int / R_min / cov-shrink ค่าทั้งหมดมาจากตารางสรุปหลักแบบ strict ชื่อ Tab_Z1_master_summary และสามารถสืบย้อนเป็นรายการ ๆ ได้ในแพ็กเกจคลังเผยแพร่

ตาราง S1a | ตัวชี้วัดเปรียบเทียบหลักของการฟิตร่วม (RC+GGL, Strict)

แบบจำลอง (workspace)

เคอร์เนล W

k

joint logL_total (ดีที่สุด)

ΔlogL_total เทียบกับ DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

ตาราง S1b | ตัวชี้วัดการปิดวงจรและความทนทาน (Strict)

แบบจำลอง (workspace)

ΔlogL ของ closure (true-perm)

ΔlogL ของตัวควบคุมเชิงลบหลัง shuffle

ช่วง ΔlogL ในการสแกน σ_int

ช่วง ΔlogL ในการสแกน R_min

ช่วง ΔlogL ในการสแกน cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 รูป S3: ความแรงการปิดวงจร (RC-only → GGL ที่พยากรณ์)

ความแรงการปิดวงจรถูกนิยามเป็น ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: ใช้ตัวอย่างโพสทีเรียร์แบบ RC-only เพื่อพยากรณ์ GGL ไปข้างหน้า แล้วเปรียบเทียบกับตัวควบคุมเชิงลบที่มีการ permute การจับคู่ RC-bin→GGL-bin

รูป S3 | ความแรงการปิดวงจร (ยิ่งสูงยิ่งดี): ความได้เปรียบ log-likelihood เฉลี่ยของการพยากรณ์ RC-only → GGL


2.3 รูป S4: การเปรียบเทียบการฟิตร่วมหลัก (RC+GGL)

ความได้เปรียบในการฟิตร่วมนิยามเป็น ΔlogL_total ≡ logL_total(model) − logL_total(DM_RAZOR) ภายใต้ข้อมูลเดียวกัน การจับคู่เดียวกัน และขนาดพารามิเตอร์เกือบเท่ากัน ตระกูล EFT ให้ค่า joint log-likelihood สูงกว่าอย่างมีนัยสำคัญ

รูป S4 | ความได้เปรียบการฟิตร่วม (ยิ่งสูงยิ่งดี): ค่า logL_total ที่ดีที่สุดสำหรับ RC+GGL เมื่อเทียบกับ DM_RAZOR


2.4 ข้อสรุปสี่ข้อ (อ้างอิงได้โดยตรง)

(1) ในการวิเคราะห์ร่วมแบบรวมของเส้นโค้งการหมุน SPARC และเลนส์ความโน้มถ่วงอ่อน KiDS-1000 แบบจำลองกรอบแรงโน้มถ่วงเฉลี่ยของ EFT เหนือกว่า DM_RAZOR อย่างเป็นระบบภายใต้โปรโตคอลควบคุมที่เข้มงวด: ΔlogL_total = 1155–1337 เมื่อเทียบกับ DM_RAZOR

(2) การทดสอบปิดวงจร RC→GGL แสดงความสอดคล้องเชิงพยากรณ์ที่แข็งแรงกว่าสำหรับ EFT: ΔlogL_closure = 172–281 เทียบกับ 127 สำหรับ DM_RAZOR เมื่อสุ่มสลับการจัดกลุ่ม RC-bin→GGL-bin สัญญาณปิดวงจรยุบลงเหลือ 6–23 แสดงว่าสัญญาณขึ้นอยู่กับการจับคู่ข้ามข้อมูลที่ถูกต้อง ไม่ใช่การฟิตโดยบังเอิญ

(3) การสแกนระบบของ σ_int, R_min และ covariance shrinkage ไม่เปลี่ยนเครื่องหมายหรือขนาดของ “EFT เหนือกว่า DM_RAZOR” บ่งชี้ว่าข้อสรุปทนทานต่อการรบกวนเชิงระบบที่พบบ่อย

(4) ภายใต้โปรโตคอลปิดวงจรเดียวกัน ภาคผนวก B (P1A) เสริมเส้นฐาน DM ในแบบ “เป็นมาตรฐานและตรวจสอบได้”: คงการเสริมแบบหนึ่งพารามิเตอร์สามรายการ (SCAT/AC/FB) และเพิ่ม hierarchical c–M scatter + prior, core proxy หนึ่งพารามิเตอร์ และ shear-calibration m ฝั่งเลนส์ (รวมทั้งแบบจำลองรวม DM_STD) ผลลัพธ์แสดงว่าเฉพาะกิ่ง feedback/core เท่านั้นที่ให้การปรับปรุงสุทธิเล็กน้อยต่อความแรงการปิดวงจร (122.21→129.45, ΔΔlogL_closure≈+7.25); การเสริมอื่น ๆ มีผลเล็กน้อยมากหรือเป็นลบต่อความแรงการปิดวงจร ดังนั้นข้อสรุปหลักไม่ได้ขึ้นอยู่กับการที่ DM_RAZOR เป็นเส้นฐานที่อ่อนเกินไป

3 ข้อมูลและการเตรียมข้อมูล

การศึกษานี้ใช้ชุดข้อมูลสาธารณะสองชุด ภายในเวิร์กโฟลว์เชิงวิศวกรรม การดาวน์โหลด การตรวจสอบ checksum (sha256) และการเตรียมข้อมูลดำเนินด้วยสคริปต์ที่สืบย้อนกลับได้ เพื่อให้การเปรียบเทียบข้ามแบบจำลองเป็นธรรม workspace ทั้งหมด (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) ใช้ผลิตภัณฑ์ข้อมูลและการจับคู่ bin ชุดเดียวกันทุกประการ


3.1 เส้นโค้งการหมุน (RC, SPARC)

ข้อมูล RC มาจากไฟล์ Rotmod_LTG ของฐานข้อมูล SPARC (ไฟล์ rotmod 175 ไฟล์) หลังการเตรียมข้อมูล ตัวอย่างสำหรับการสร้างแบบจำลองมี 104 ดาราจักรและจุดข้อมูล (r, V_obs) จำนวน 2,295 จุด แบ่งเป็น 20 RC bins ตามมวลดาวและเกณฑ์ที่เกี่ยวข้อง จุดข้อมูลแต่ละจุดประกอบด้วยรัศมี r (kpc), ความเร็วสังเกต V_obs (km/s), ความคลาดเคลื่อนสังเกต σ_obs และความเร็วองค์ประกอบแก๊ส/จาน/ป่องกลาง (V_gas, V_disk, V_bul)


3.2 เลนส์ความโน้มถ่วงอ่อน (GGL, KiDS-1000 / Brouwer+2021)

ข้อมูล GGL ใช้ความหนาแน่นผิวส่วนเกิน ΔΣ(R) จากรูปที่ 3 ของ Brouwer et al. (2021) อิง KiDS-1000 (4 bin มวลดาว, 15 จุด R ต่อ bin) พร้อม covariance เต็มที่ให้มา ในเวิร์กโฟลว์เชิงวิศวกรรม covariance แบบ long-form เดิมถูกสร้างใหม่เป็นเมทริกซ์ 15×15 สำหรับแต่ละ bin และการตรวจสอบ Stage-B ตรวจสอบความสมเหตุสมผลด้านมิติและตัวเลข


3.3 การจับคู่ RC-bin → GGL-bin และขนาดตัวอย่างรวม

bin มวล GGL จำนวน 4 bin และ RC bins จำนวน 20 bin เชื่อมกันผ่านการจับคู่คงที่: GGL bin แต่ละ bin สอดคล้องกับ RC bins 5 bin และถ่วงน้ำหนักการมีส่วนร่วมของ RC-bin ตามจำนวนดาราจักร การจับคู่นี้ถูกตรึงไว้เหมือนกันในทุกแบบจำลอง และเป็นข้อจำกัดแกนกลางสำหรับการเปรียบเทียบอย่างเป็นธรรมในการทดสอบปิดวงจรและการฟิตร่วม ชุดข้อมูลร่วมสุดท้ายมี n_total = 2355 จุด (RC=2295, GGL=60)

4 แบบจำลองและวิธีการทางสถิติ


4.1 ข้อกำหนดทางคณิตศาสตร์ขั้นต่ำสำหรับ EFT และ DM (ตรวจสอบได้/ทดสอบได้)

หัวข้อนี้ให้ข้อกำหนดทางคณิตศาสตร์ขั้นต่ำที่เชื่อมตรงกับการใช้งานจริง

(a) แบบจำลองเส้นโค้งการหมุน (RC)

สำหรับจุดข้อมูล RC แต่ละจุด (r, V_obs, σ_obs) เราใช้การซ้อนทับขององค์ประกอบ: V_mod²(r) = V_bar²(r) + V_extra²(r) โดย V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r) ผลลัพธ์หลักในบทความนี้ใช้ Υ_d = Υ_b = 0.5 ซึ่งสอดคล้องกับคำแนะนำเชิงประจักษ์ของ SPARC และช่วยลดดีกรีอิสระที่ไม่จำเป็น

(b) การแก้ไขแรงโน้มถ่วงเฉลี่ยของ EFT (EFT)

เทอมส่วนเพิ่มของ EFT ถูกทำพารามิเตอร์ในรูป “ความเร็วเฉลี่ยยกกำลังสอง”: V_extra²(r) = V0_bin² · f(r/ℓ) โดย V0_bin คือพารามิเตอร์แอมพลิจูดของ RC bin แต่ละ bin (20 พารามิเตอร์), ℓ คือสเกลระดับโลก (1 พารามิเตอร์), และ f(x) คือฟังก์ชันรูปร่างเคอร์เนลไร้มิติ รูปร่างเคอร์เนลที่เปรียบเทียบในบทความนี้ (ไม่มีแบบใดเพิ่มดีกรีอิสระต่อเนื่องเพิ่มเติม) ได้แก่:

แรงจูงใจทางฟิสิกส์ (ขยาย): EFT ตีความการตอบสนองแรงโน้มถ่วงส่วนเพิ่มในสเกลดาราจักรว่าเป็นการตอบสนองมีผลที่ได้จากการทำ coarse-graining/scale-averaging ของการกระทำจุลภาคมากขึ้นบนสเกลจำกัด ในบทความนี้ เราไม่สมมติกลไกจุลภาคเฉพาะใด ๆ แต่ใช้พารามิเตอร์ไรเซชันขั้นต่ำที่ตรวจสอบได้เพื่อการเปรียบเทียบแบบควบคุมและการทดสอบภายใต้โปรโตคอลสถิติแบบรวม

เพื่อช่วยสร้างสัญชาตญาณ เทอมส่วนเพิ่มสามารถเขียนในรูปความเร่งได้ว่า a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ) เมื่อ r≫ℓ, f→1 และ V_extra→V0_bin ทำให้เกิดส่วนเพิ่มความเร็วบริเวณนอกที่เกือบแบน เมื่อ r≪ℓ และ f(x)≈x สามารถนิยามสเกลความเร่งลักษณะ a0,bin≈V0_bin²/ℓ ได้ (ต่างกันด้วยปัจจัยฟังก์ชันเคอร์เนลลำดับ O(1)) ซึ่งให้สัญชาตญาณแบบ MOND-like สำหรับสเกลการเปลี่ยนผ่านจากด้านในสู่ด้านนอก

ตระกูลเคอร์เนลไม่ต่อเนื่องที่ใช้ที่นี่ (none/exponential/yukawa/powerlaw_tail) สามารถมองเป็นตัวแทนมิติต่ำของ “ความชันเริ่มต้น / ความเร็วการเปลี่ยนผ่าน / หางระยะไกล” ที่แตกต่างกัน (เช่น การ screen แบบ Yukawa เทียบกับการตอบสนองที่มีหางยาวกว่า) พวกมันถูกใช้เพื่อทดสอบแรงกดดันด้านความทนทาน ไม่ใช่เพื่อสำรวจปริภูมิแบบจำลองให้หมด ในองค์ประกอบเลนส์ความโน้มถ่วงอ่อน เราสร้างมวลและความหนาแน่นของ envelope มีผลจาก V_avg(r) แล้วฉายเพื่อให้ได้ ΔΣ(R) ความหนาแน่นมีผลนี้ควรเข้าใจว่าเป็นคำอธิบายมีผลของศักย์เลนส์ภายใต้สมมติฐานสมมาตรทรงกลมและการจับคู่สนามอ่อน (รายละเอียดเต็มย้ายไปไว้ในภาคผนวก A)

รูปร่างเคอร์เนลทั้งหมดข้างต้นเป็นไปตาม f(x)→1 เมื่อ x→∞ (กล่าวคือ V_extra² อิ่มตัวสู่ V0²) และให้การเติบโตเชิงเส้นหรือกึ่งเชิงเส้นสำหรับ x≪1 เช่น exponential: f≈x; yukawa: f≈0.5x; powerlaw_tail: f≈0.5x ดังนั้นรูปร่างเคอร์เนลต่าง ๆ จึงมีความแตกต่างที่สังเกตได้ใน “ความชันเริ่มต้น” ที่รัศมีเล็ก ความเร็วการเปลี่ยนผ่าน และหางด้านนอก และสามารถแยกแยะได้ด้วยการฟิตร่วม RC+GGL และการทดสอบปิดวงจร

คำพยากรณ์ของ EFT สำหรับ ΔΣ(R) ของเลนส์ความโน้มถ่วงอ่อนได้จากการอนุมานมวล envelope และความหนาแน่นจาก V_avg(r) แล้วตามด้วยอินทิกรัลการฉาย: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr และ ΔΣ(R)=Σ̄(<R)−Σ(R) การใช้งานเชิงตัวเลขใช้กริดลอการิทึมและปรับละเอียดแบบปรับตัวในกรณีพิเศษเพื่อรับประกันเสถียรภาพและการทำซ้ำผล

(c) DM_RAZOR: เส้นฐานฮาโล NFW ของสสารมืดเย็น

ขณะเดียวกัน เราชี้แจงว่า DM_RAZOR เป็นเพียงเส้นฐาน NFW ขั้นต่ำที่ตรวจสอบได้ (c–M คงที่และไม่มี scatter; ไม่มี adiabatic contraction, feedback core, ความไม่ทรงกลม หรือเทอมสิ่งแวดล้อม) เพื่อลดความเสี่ยงของ “เส้นฐานหุ่นฟาง” บทความนี้ไม่ได้อ้างว่าผลดังกล่าวไม่มีอยู่ แต่รวมมันไว้ในภาคผนวก B (P1A) ในฐานะการทดสอบแรงกดดันมิติต่ำที่ตรวจสอบได้ รวมถึงการจัดการ c–M scatter แบบลำดับชั้น, core proxy และ nuisance ของ shear-calibration ฝั่งเลนส์


4.2 บัญชีแบบจำลองและการเปรียบเทียบอย่างเป็นธรรม (พารามิเตอร์ร่วม = นิยามของการปิดวงจร)

จำนวนพารามิเตอร์ในชุดเปรียบเทียบหลักคือ: DM_RAZOR k=20; ตระกูล EFT k=21 (พารามิเตอร์ที่เพิ่มคือ log ℓ ระดับโลก) แบบจำลองทั้งหมดใช้ข้อมูล RC เดียวกัน ข้อมูล GGL และ covariance เดียวกัน การจับคู่ RC-bin→GGL-bin เดียวกัน เทอม baryonic เดียวกัน และการแปลงหน่วยเดียวกัน นอกจากนี้ รูปร่างเคอร์เนล (none / exponential / yukawa / powerlaw_tail) เป็นตัวเลือกไม่ต่อเนื่องและไม่เพิ่มพารามิเตอร์ต่อเนื่องเพิ่มเติม จึงป้องกันไม่ให้ได้เปรียบจาก “ดีกรีอิสระเพิ่มอีกหนึ่งตัว”


4.3 Likelihood, Priors และ Sampler

likelihood ของ RC เป็น Gaussian แนวทแยง: σ_eff² = σ_obs² + σ_int² ผลลัพธ์หลักตรึง σ_int=5 km/s และ Run-5 สแกน σ_int likelihood ของ GGL ใช้ Gaussian แบบ covariance เต็มสำหรับแต่ละ bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b) เป้าหมายร่วมคือ logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ) ไพรเออร์ส่วนใหญ่เข้ารหัสขอบเขตที่เป็นไปได้ทางฟิสิกส์ (ข้อจำกัดช่วงของ log ℓ, log V0 และ log M200); เมื่อเปิดใช้งาน Υ และ σ_int แบบอิสระ จะใช้ไพรเออร์ให้ข้อมูลอ่อน (ดูรายละเอียดในการใช้งานและการตั้งค่าแพ็กเกจเผยแพร่)

ตัวสุ่มตัวอย่างใช้ adaptive block Metropolis random walk: แต่ละขั้นอัปเดตเฉพาะ sub-block แบบสุ่มของปริภูมิพารามิเตอร์เพื่อเพิ่มอัตราการยอมรับในมิติสูง และปรับขนาดก้าวเล็กน้อยตามอัตราการยอมรับแบบ windowed (อัตรายอมรับเป้าหมายประมาณ 0.25) ผลลัพธ์หลักใช้ quick mode (เช่น n_steps=800) และ workspace แต่ละชุดส่งออก traces, residuals และ PPC plots สำหรับการตรวจสอบทั้งด้วยมือและสคริปต์


4.4 การทดสอบปิดวงจรและตัวควบคุมเชิงลบ (นิยาม)

การทดสอบปิดวงจร (Run-2) ทดสอบว่าโพสทีเรียร์แบบ RC-only สามารถพยากรณ์ GGL โดยไม่ต้องฟิต GGL ใหม่ได้หรือไม่ โดยเฉพาะ มันสร้าง ΔΣ(R) ไปข้างหน้าสำหรับ GGL 4 bins จากตัวอย่างโพสทีเรียร์ RC-only และคำนวณ logL_true ด้วย covariance เต็ม จากนั้นสุ่ม permute การจับคู่กลุ่ม RC-bin→GGL-bin เพื่อให้ได้ logL_perm ความแรงการปิดวงจรนิยามเป็น ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩ นอกจากนี้ Run-10 สุ่มจัดกลุ่ม RC bins 20 bin ใหม่เป็น 4×5 (shuffle) และคำนวณ closure ใหม่ เพื่อตรวจว่าการปิดวงจรขึ้นกับการจับคู่ที่ถูกต้องแรงเพียงใด

5 ผลลัพธ์หลักและการตีความ


5.1 ผลลัพธ์การฟิตร่วมหลัก (RC+GGL)

ค่า logL_total ที่ดีที่สุดจากการฟิตร่วมและความได้เปรียบสัมพัทธ์ ΔlogL_total (เทียบกับ DM_RAZOR) แสดงไว้ในตาราง S1a และรูป S4 ในชุดเปรียบเทียบหลัก EFT_BIN มีความได้เปรียบในการฟิตร่วมมากที่สุด (ΔlogL_total=1337.210) ขณะที่รูปร่างเคอร์เนล EFT อื่น ๆ ก็ยังคงความได้เปรียบอย่างมีนัยสำคัญ (1154.827–1294.442) ภายใต้เกณฑ์สารสนเทศ (AICc/BIC) ตระกูล EFT ก็เหนือกว่า DM_RAZOR อย่างมีนัยสำคัญเช่นกัน แสดงว่าความได้เปรียบไม่ได้เกิดจากอคติด้านจำนวนพารามิเตอร์

หมายเหตุ: ส่วนหลักของ ΔlogL_total≈1337 มาจากเทอม RC (ΔlogL_RC≈1065 ในการแยกองค์ประกอบการฟิตร่วม ประมาณ 80%) สิ่งนี้เข้าใจได้ว่าเป็นการปรับปรุงปานกลางราว Δχ²≈0.90 ต่อจุดในข้อมูล RC จำนวน N=2295 จุด ซึ่งสะสมโดยธรรมชาติเป็นความได้เปรียบลำดับ 10^3 ภายใต้ likelihood Gaussian แนวทแยง ในเวลาเดียวกัน GGL และการทดสอบปิดวงจรให้ข้อจำกัดข้ามชุดข้อมูลที่เป็นอิสระ และลำดับอันดับยังคงเสถียรภายใต้การทดสอบแรงกดดัน σ_int, R_min และ cov-shrink (ดูหัวข้อ 6 และตาราง S1b)


5.2 ผลลัพธ์การทดสอบปิดวงจร (RC-only → GGL)

ปริมาณสำคัญของการทดสอบปิดวงจร ΔlogL_closure รายงานไว้ในตาราง S1b และรูป S3 ตระกูล EFT มีความแรงการปิดวงจร 171.977–280.513 สูงกว่า 126.678 ของ DM_RAZOR หมายความว่า เมื่อไม่อนุญาตดีกรีอิสระข้ามข้อมูลเพิ่มเติม ตัวอย่างโพสทีเรียร์ที่ EFT ได้จากข้อมูล RC มีพลังพยากรณ์ที่ถ่ายโอนได้สู่ข้อมูล GGL แข็งแรงกว่า

ตัวควบคุมเชิงลบสนับสนุนความหมายทางฟิสิกส์ของสัญญาณปิดวงจรเพิ่มเติม: เมื่อสุ่ม shuffle การจัดกลุ่ม RC-bin→GGL-bin ความแรงการปิดวงจรของ EFT ลดลงเหลือ 6–15 (ต่างกันเล็กน้อยระหว่างเคอร์เนล) ในขณะที่ความแรงการปิดวงจรฐานสูงถึง 172–281 “การยุบตัวของสัญญาณ” นี้ตัดความได้เปรียบเทียมที่เกิดจากการใช้งานเชิงตัวเลข ข้อผิดพลาดหน่วย หรือการจัดการ covariance ที่ไม่เหมาะสมออกไป

รูป R1 | ตัวควบคุมเชิงลบ: หลัง shuffle grouping สัญญาณปิดวงจรลดลงอย่างมีนัยสำคัญ (วาดจากตัวชี้วัด Tab_Z1)


5.3 ความหมายและขีดจำกัดของผลลัพธ์

ข้อสรุปของการศึกษานี้คือ “ภายใต้ชุดข้อมูลและโปรโตคอลนี้ การแก้ไขแรงโน้มถ่วงเฉลี่ยของ EFT เหนือกว่าเส้นฐาน DM_RAZOR ที่ทดสอบแล้ว” ต้องเน้นว่าฝั่ง DM ใช้เพียงเส้นฐาน NFW ขั้นต่ำที่มีความสัมพันธ์ c(M) คงที่ โดยไม่มีการก่อตัว core, ความไม่ทรงกลม, เทอมสิ่งแวดล้อม หรือแบบจำลองการเชื่อมต่อดาราจักร–ฮาโลที่ซับซ้อนกว่า ดังนั้นต้นฉบับนี้ไม่ได้อ้างว่าตัดแบบจำลอง DM ทุกตระกูลออก แต่ให้เส้นฐานควบคุมที่ทำซ้ำได้และยึดการทดสอบปิดวงจรเป็นแกน เพื่อประเมินว่า RC และ GGL สามารถอธิบายอย่างสอดคล้องด้วยพารามิเตอร์และการจับคู่ข้ามข้อมูลเดียวกันได้หรือไม่

เพื่อจัดการข้อกังวลทั่วไปนี้ เราดำเนินโครงการขยายอิสระ P1A เสร็จสมบูรณ์ (ดูภาคผนวก B) โดยไม่เปลี่ยนการจับคู่ร่วม RC-bin→GGL-bin หรือกรอบการตรวจสอบ โครงการนี้เสริมเส้นฐาน DM ในแบบ “เป็นมาตรฐานและตรวจสอบได้”: นอกจากการเสริมหนึ่งพารามิเตอร์สามรายการ (SCAT/AC/FB) ยังเพิ่ม (i) hierarchical c–M scatter + mass–concentration prior (DM_HIER_CMSCAT), (ii) core proxy จาก baryonic feedback หนึ่งพารามิเตอร์ (DM_CORE1P), และ (iii) nuisance m ของ shear-calibration ฝั่งเลนส์ความโน้มถ่วงอ่อน (DM_RAZOR_M) พร้อมรายงานแบบจำลองรวม DM_STD; EFT_BIN ถูกคงไว้เป็นอ้างอิงควบคุม

• DM_RAZOR_SCAT (c–M scatter) — แนะนำพารามิเตอร์ scatter ของความเข้มข้นระหว่างฮาโล σ_logc เพื่อทดสอบว่า c(M) แบบคงที่ประเมินพลังอธิบายของ DM ต่ำไปอย่างเป็นระบบหรือไม่;
• DM_RAZOR_AC (Adiabatic Contraction) — ใช้พารามิเตอร์เดี่ยว α_AC เพื่ออินเตอร์โพเลตต่อเนื่องระหว่าง “ไม่มีการหดตัว” กับ “การหดตัวมาตรฐาน” โดยจับแนวโน้มที่ baryon ทำให้ฮาโลส่วนในหดตัวด้วยต้นทุนมิติต่ำ;
• DM_RAZOR_FB (Feedback/core) — ใช้สเกล core (เช่น log r_core) เพื่ออธิบายว่าการก่อตัวของ core ด้านในกดเส้นโค้งการหมุนอย่างไร พร้อมคงการประมาณ NFW ในสเกลเลนส์ความโน้มถ่วงอ่อน

scoreboard เชิงปริมาณของ P1A ให้ไว้ในภาคผนวก B ตาราง B1 / รูป B1 (สร้างอัตโนมัติจาก Tab_S1_P1A_scoreboard) ในตัวชี้วัดปิดวงจร DM_RAZOR_FB ให้การปรับปรุงสุทธิเล็กน้อย (122.21→129.45, +7.25) ขณะที่การเสริมอื่น ๆ มีผลเล็กน้อยมากหรือเป็นลบต่อความแรงการปิดวงจร ด้านการฟิตร่วม การเพิ่ม hierarchical c–M scatter prior (DM_HIER_CMSCAT) หรือแบบจำลองรวม (DM_STD) สามารถปรับปรุง joint logL ได้มาก แต่ไม่ได้เพิ่มความแรงการปิดวงจร สื่อว่ามันเพิ่มความยืดหยุ่นในการฟิตร่วมเป็นหลัก ไม่ใช่ความสามารถในการถ่ายโอนข้ามโพรบ ดังนั้นข้อสรุปแกนกลางของเนื้อหาหลักควรอ่านดังนี้: ภายใต้ข้อจำกัดการจับคู่ร่วมและการทดสอบปิดวงจรที่เข้มงวด ความได้เปรียบด้านความสอดคล้องข้ามข้อมูลของ EFT ไม่ได้เกิดจากการเลือก “เส้นฐานที่อ่อนเกินไป” ฝั่ง DM แพ็กเกจเผยแพร่ P1A ที่สอดคล้องกับภาคผนวก B (ตาราง/รูปเสริมและ full_fit_runpack) จะถูกรวมเป็นไฟล์เพิ่มเติมภายใต้ Zenodo Concept DOI เดียวกับ full_fit_runpack ของบทความนี้: https://doi.org/10.5281/zenodo.18526286

6 การทดลองด้านความทนทานและการควบคุม


6.1 การสแกน σ_int (Run-5)

เราสแกน intrinsic RC scatter σ_int อย่างเป็นระบบ และทำการอนุมานร่วมซ้ำที่ค่า σ_int แต่ละค่า โดยคำนวณ ΔlogL_total เมื่อเทียบกับ DM_RAZOR ค่าต่ำสุด/สูงสุดของ ΔlogL_total สำหรับแต่ละแบบจำลองตลอดช่วงสแกนถูกรายงานในตาราง S1b

รูป R2 | ช่วงของ ΔlogL_total ภายใต้การสแกน σ_int (ยิ่งสูงยิ่งดี)


6.2 การสแกน R_min (Run-6)

เพื่อทดสอบผลกระทบของระบบผิดพลาดในข้อมูลบริเวณกลาง (เช่น การเคลื่อนที่ไม่เป็นวงกลม ความละเอียด และการสร้างแบบจำลอง baryonic ไม่เพียงพอ) เราใช้การตัด threshold R_min กับ RC และทำการอนุมานร่วมซ้ำ ความได้เปรียบของตระกูล EFT ยังคงเป็นบวกและเสถียรในขนาดภายใต้การสแกน R_min

รูป R3 | ช่วงของ ΔlogL_total ภายใต้การสแกน R_min (ยิ่งสูงยิ่งดี)


6.3 การสแกน cov-shrink (Run-7)

เพื่อทดสอบความไม่แน่นอนใน covariance ของ GGL เราใช้ shrinkage กับเมทริกซ์ covariance ของแต่ละ mass bin: C_α=(1−α)C+α·diag(C) และสแกน α ผลลัพธ์แสดงว่าความได้เปรียบของตระกูล EFT ไม่ไวต่อการจัดการแบบนี้

รูป R4 | ช่วงของ ΔlogL_total ภายใต้การสแกน cov-shrink (ยิ่งสูงยิ่งดี)


6.4 บันไดการตัดองค์ประกอบ (Run-8)

ภายใน EFT_BIN เราทำ nested ablations: ตั้งแต่แบบจำลองขั้นต่ำ (ไม่มีพารามิเตอร์อิสระ) ไปจนถึงเวอร์ชันที่คงดีกรีอิสระจำนวนน้อย และสุดท้ายคือแบบจำลองสมบูรณ์ที่มีแอมพลิจูด 20 bins + สเกลระดับโลก AICc/BIC แสดงว่าข้อมูลต้องการแบบจำลอง EFT_BIN สมบูรณ์อย่างชัดเจน

รูป R5 | บันได ablation ของ EFT_BIN (AICc; ยิ่งต่ำยิ่งดี)


6.5 การพยากรณ์แบบกันไว้ทดสอบ (Run-9)

เรารันการทดสอบ leave-one-bin-out (LOO) เพิ่มเติม: ในบรรดา 4 GGL mass bins จะกันไว้ครั้งละหนึ่ง bin; ทำการอนุมานใหม่ด้วย bins ที่เหลือ (และ RC ทั้งหมด) แล้วประเมิน test log-likelihood บน bin ที่กันไว้ ตัวชี้วัดสรุปให้ไว้ในตารางเสริม Tab_R3_leave_one_bin_out (ผลิตภัณฑ์ Run-9; รูปแบบพาธไฟล์ระบุไว้ในรายการผลิตภัณฑ์สำคัญในหัวข้อ 8.2) ตระกูล EFT ยังคงเหนือกว่า DM_RAZOR อย่างชัดเจน แม้ในกรณีกันไว้ที่แย่ที่สุด

รูป R6 | LOO: การกระจาย log-likelihood สำหรับ bin ที่กันไว้ (จากผลิตภัณฑ์ Run-9)


6.6 ตัวควบคุมเชิงลบ: RC-bin Shuffle (Run-10)

Run-10 สุ่มจัดกลุ่ม RC bins 20 bin ใหม่เป็น 4×5 และคำนวณ closure ใหม่โดยคงโพสทีเรียร์ RC-only ไว้ไม่เปลี่ยน ผลลัพธ์แสดงว่าเมื่อเทียบกับการจับคู่เดิม การ shuffle ลดทั้งค่าเฉลี่ย closure logL_true และ ΔlogL_closure ลงอย่างมีนัยสำคัญ (ดูตาราง S1b และรูป R1) สนับสนุนการตีความได้ของสัญญาณปิดวงจรเพิ่มเติม

รูป R7 | ตัวควบคุมเชิงลบ: การ shuffle mapping ทำให้ค่าเฉลี่ย closure logL_true ลดลงชัดเจน (จากผลิตภัณฑ์ Run-10)

7 การสืบย้อนและการตรวจสอบความสอดคล้อง (Provenance)

ค่าตัวเลขทั้งหมดที่อ้างในบทความนี้สามารถสืบย้อนเป็นรายการ ๆ ได้ในตารางสรุปแบบ strict และบันทึกการตรวจสอบของคลังเผยแพร่ เพื่อให้เนื้อหาหลักอ่านง่ายขึ้น ห่วงโซ่ provenance เต็มรูปแบบ (รายการแท็ก ตารางตรวจสอบ รายการ checksum และวิธีตรวจยืนยัน) ถูกย้ายไปไว้ในภาคผนวก A

8 การทำซ้ำผลและคลัง Zenodo

ถ้อยแถลงความพร้อมของข้อมูลและโค้ด: ข้อมูลเส้นโค้งการหมุน SPARC และข้อมูลเลนส์ความโน้มถ่วงอ่อน KiDS-1000 ที่ใช้ในบทความนี้เป็นชุดข้อมูลสาธารณะ รายงานระดับเผยแพร่ถูกเก็บถาวรบน Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334) และแพ็กเกจทำซ้ำผลฉบับเต็มถูกเก็บถาวรบน Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286) ขั้นตอนดำเนินการอย่างละเอียด สภาพแวดล้อม dependency บัญชีรายการคลัง และข้อมูลตรวจ hash ให้ไว้ในภาคผนวก A; การออกแบบ แท็กการรัน และผลลัพธ์ของการทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน (P1A) ให้ไว้ในภาคผนวก B

ภายใต้ Concept DOI ของแพ็กเกจทำซ้ำผลฉบับเต็มเดียวกัน (https://doi.org/10.5281/zenodo.18526286) เราให้จุดเข้าใช้ที่ทำซ้ำได้สองชุดตามกรณีใช้งาน: • P1 (เนื้อหาหลัก) full_fit_runpack: ทำซ้ำการวิเคราะห์ RC-only / closure / joint และการสแกนความทนทานสำหรับ EFT เทียบกับ DM_RAZOR พร้อมสร้างสินทรัพย์เนื้อหาหลัก เช่น ตาราง S1a/S1b และรูป S3/S4; • P1A (ภาคผนวก B) full_fit_runpack: ทำซ้ำการทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน (SCAT/AC/FB + hierarchical c–M scatter prior + core1p + lensing m + DM_STD รวมถึงตัวควบคุม EFT_BIN) พร้อมสร้างตารางภาคผนวก B1 และรูป B1 ตาราง/รูปเสริมและ full_fit_runpack ของ P1A จะถูกรวมเป็นไฟล์เพิ่มเติมภายใต้ Concept DOI เดียวกัน เพื่อรักษาจุดเข้าคลังเพียงจุดเดียว

9 คำขอบคุณและถ้อยแถลง


9.1 คำขอบคุณ

เราขอขอบคุณทีม SPARC และ KiDS-1000 ที่ให้ข้อมูลและเอกสารสาธารณะ และขอบคุณผู้เข้าร่วมเวิร์กโฟลว์การสร้างใหม่และการตรวจสอบของโครงการนี้


9.2 การมีส่วนร่วมของผู้เขียน

Guanglin Tu รับผิดชอบข้อเสนอแนวคิด การออกแบบการศึกษา การใช้งานเชิงวิศวกรรม การจัดการข้อมูล การวิเคราะห์เชิงรูปแบบ การใช้งานและตรวจสอบเวิร์กโฟลว์การทำซ้ำผล และการเขียนต้นฉบับ


9.3 ทุนสนับสนุน

ผู้เขียน Guanglin Tu สนับสนุนทุนด้วยตนเอง (ไม่มีทุนภายนอก / ไม่มีหมายเลขทุน)


9.4 ผลประโยชน์ทับซ้อน

ผู้เขียน Guanglin Tu สังกัด “คณะทำงาน EFT, Shenzhen Energy Filament Science Research Co., Ltd. (ประเทศจีน)”; ไม่มีการประกาศผลประโยชน์ทับซ้อนอื่น


9.5 ความช่วยเหลือจาก AI

OpenAI GPT-5.2 Pro และ Gemini 3 Pro ถูกใช้เพื่อขัดเกลาภาษา แก้ไขโครงสร้าง และจัดระเบียบเวิร์กโฟลว์การทำซ้ำผล ไม่ได้ใช้เพื่อสร้างหรือแก้ไขข้อมูล ผลลัพธ์ รูปภาพ ตาราง หรือโค้ด และไม่ได้ใช้เพื่อสร้างการอ้างอิง ผู้เขียนรับผิดชอบเนื้อหาและความถูกต้องของการอ้างอิงทั้งหมดของต้นฉบับแต่เพียงผู้เดียว

10 เอกสารอ้างอิง

ภาคผนวก A: รายละเอียดการสืบย้อนและการทำซ้ำผล

ภาคผนวกนี้สรุปข้อมูลคลังระยะยาวเพื่อการสืบย้อนและการทำซ้ำผล รวมถึง run tags ผลการตรวจสอบ บัญชีรายการคลัง และจุดตรวจยืนยันสำคัญ เพื่อให้ผู้อ่านสามารถตรวจสอบและทำซ้ำงานได้ตามต้องการ


A.1 รายละเอียดการสืบย้อนและการตรวจสอบ

เพื่อให้สืบย้อนระยะยาวได้ โครงการนี้ใช้แท็กประทับเวลาสำหรับแต่ละการรันและผลลัพธ์ และเก็บผลิตภัณฑ์ย้อนหลังโดยไม่เขียนทับ ค่าหลักที่อ้างในต้นฉบับนี้มาจากการคอมไพล์แบบ strict (compile_tag=20260205_035929) และผ่านการตรวจสอบความสอดคล้องดังต่อไปนี้:

• ตารางระดับ stage ทั้งหมดมี run_tag และ stage tags; สคริปต์คอมไพล์แบบ strict เลือกแหล่งตาราง canonical ที่ “สมบูรณ์และสอดคล้อง” จาก report/tables

• ค่าใน Tab_Z1_master_summary และ Tab_Z2_conclusion_highlights ถูกเปรียบเทียบเป็นรายการ ๆ กับตาราง canonical ที่เลือก

• ระหว่างการสร้าง PDF มีการตรวจแท็กของ “แท็กตาราง/รูปที่ถูกอ้างถึง” เพื่อให้แน่ใจว่าไม่มีผลิตภัณฑ์ล้าสมัยปะปนอยู่

แท็กสำคัญ (สำหรับระบุตำแหน่งผลิตภัณฑ์กลางทั้งหมด): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442

ผลการตรวจสอบความสอดคล้อง: Tab_AUDIT_checks_strict รายงาน pass=9, fail=0, skip=0 (ดูรายละเอียดในแพ็กเกจเผยแพร่)


A.2 ขั้นตอนการทำซ้ำผลและบัญชีรายการคลัง

การศึกษานี้ใช้ระบบการทำซ้ำผลที่ประกอบด้วย “รายงานระดับเผยแพร่ + ส่วนเสริมตาราง/รูป + แพ็กเกจรันซ้ำได้เต็มรูปแบบ” ผู้อ่านสามารถดู Tables & Figures Supplement โดยตรงเพื่อตรวจยืนยันสินทรัพย์ตาราง/รูปทั้งหมดที่อ้างในบทความ หากต้องการทำซ้ำค่าตัวเลขและห่วงโซ่การตรวจสอบตั้งแต่ต้น สามารถใช้ full_fit_runpack เพื่อดาวน์โหลดข้อมูลและรันเวิร์กโฟลว์ทั้งหมดซ้ำ หลังเสร็จสิ้น สามารถใช้สคริปต์เปรียบเทียบตารางอ้างอิงในตัวของแพ็กเกจเพื่อตรวจยืนยันความสอดคล้องของค่าตาราง


A.2.1 จุดเริ่มต้นทำซ้ำผลแบบรวดเร็ว (RUN_FULL, Windows PowerShell)

หัวข้อนี้ให้เส้นทางทำซ้ำผลที่สั้นกว่า (Windows PowerShell) สำหรับการตรวจเร็ว ผู้อ่านควรดู Tables & Figures Supplement โดยตรงและตรวจตารางกับรูปที่อ้างเป็นรายการ ๆ สำหรับการทำซ้ำปลายทางถึงปลายทางและการสร้างตาราง รูป และผลิตภัณฑ์ตรวจสอบทั้งหมด ให้ใช้ full_fit_runpack: ทำตาม README/ONE_PAGE_REPRO_CHECKLIST ของแพ็กเกจเพื่อรัน verify_checksums.ps1 และ RUN_FULL.ps1 (แนะนำ Mode=full)

รายการคลัง Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286
แท็กสายหลักของบทความนี้: run_tag=20260204_122515; strict compile_tag=20260205_035929; release_tag=20260205_112442


A.2.2 วัสดุคลังและจุดตรวจยืนยันสำคัญ (Packages & checks)

คลัง Zenodo ให้หมวดวัสดุที่เสริมกันสามประเภท: (1) รายงานระดับเผยแพร่ (บทความนี้ v1.1; รวมภาคผนวก B: การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐานของ P1A); (2) Tables & Figures Supplement (ตารางและรูปเสริมที่ครอบคลุมสินทรัพย์ตาราง/รูปทั้งหมดที่อ้างในบทความนี้ แยกสอดคล้องกับ P1 และ P1A); และ (3) full_fit_runpack (แพ็กเกจทำซ้ำผลฉบับเต็ม: ดาวน์โหลดข้อมูลตั้งแต่ต้นและรันเวิร์กโฟลว์ทั้งหมดซ้ำ แยกสอดคล้องกับ P1 และ P1A) รายการ (1)–(2) สนับสนุนการอ่านเร็วและการตรวจยืนยันอิสระ ส่วนรายการ (3) ให้การทำซ้ำผลครบวงจรตั้งแต่ต้นจนจบ

หมวดวัสดุ

ชื่อไฟล์ (ตัวอย่าง)

วัตถุประสงค์และการวางตำแหน่ง (ลำดับใช้งานที่แนะนำ)

รายงานระดับเผยแพร่ (จีนและอังกฤษ)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

รายงานฉบับสมบูรณ์ที่เก็บถาวรบน Zenodo; เนื้อหาหลักให้ข้อสรุปแกนกลางและการตรวจสอบความทนทาน ส่วนภาคผนวก B ให้ P1A (การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน)

Tables & Figures Supplement (P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

ตารางทั้งหมด (CSV) และรูปทั้งหมด (PNG) ที่อ้างในเนื้อหาหลัก รวมถึงสคริปต์สร้างและไฟล์แท็ก

Tables & Figures Supplement (P1A)

P1A_supplement_figs_tables_v1.zip

ตารางและรูปทั้งหมดที่อ้างในภาคผนวก B (P1A) รวมถึง Tab_S1_P1A_scoreboard และ Fig_S1_P1A_scoreboard

full_fit_runpack (P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

การทำซ้ำผลเต็มรูปแบบแบบปลายทางถึงปลายทาง: ดาวน์โหลดข้อมูลตั้งแต่ต้นและรัน RC-only/closure/joint รวมถึงการสแกนความทนทานซ้ำ

full_fit_runpack (P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

การทำซ้ำผลเต็มรูปแบบแบบปลายทางถึงปลายทาง (ภาคผนวก B): รัน DM 7+1 + DM_STD (รวมตัวควบคุม EFT_BIN) ซ้ำและสร้างสินทรัพย์ภาคผนวก; แพ็กเกจมีสคริปต์เปรียบเทียบตารางอ้างอิงเพื่อตรวจยืนยันความสอดคล้องของค่าตาราง

ข้อเสนอแนะการอ้างอิง: เมื่ออ้างบทความนี้หรือวัสดุทำซ้ำผลประกอบ โปรดอ้าง Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334)

ผลิตภัณฑ์สำคัญที่ควรปรากฏและเปรียบเทียบได้หลังการทำซ้ำผล ได้แก่:

ภาคผนวก B: P1A—การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน (DM 7+1 + DM_STD; มีตัวควบคุม EFT)

ภาคผนวกนี้บันทึกโครงการขยาย (P1A) สำหรับ “การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน” ซึ่งสอดคล้องกับโปรโตคอลปิดวงจรในเนื้อหาหลัก บทบาทของมันคือยกระดับเส้นฐาน DM_RAZOR ขั้นต่ำที่ใช้ในเนื้อหาหลัก (NFW + c–M คงที่, ไม่มี scatter / ไม่มี contraction / ไม่มี core) ให้เป็นชุดเส้นฐาน DM ที่ใกล้กับการปฏิบัติทางดาราศาสตร์ฟิสิกส์และทนต่อข้อวิจารณ์ทั่วไปมากขึ้น โดยไม่เพิ่มดีกรีอิสระจำนวนมาก และไม่เปลี่ยนการจับคู่ร่วม RC-bin→GGL-bin หรือกรอบการตรวจสอบ P1A ครอบคลุมและเป็น superset ของการทดสอบแรงกดดันสามกิ่งก่อนหน้า: คง SCAT/AC/FB ไว้ พร้อมเพิ่ม hierarchical c–M scatter + prior, core proxy หนึ่งพารามิเตอร์ และ nuisance m ของ shear-calibration ฝั่งเลนส์; ยังให้แบบจำลองรวม DM_STD อีกด้วย EFT_BIN ถูกคงไว้เป็นอ้างอิงควบคุม

หมายเหตุเสริม: ความแรงการปิดวงจรและค่าที่เกี่ยวข้องในภาคผนวก B (P1A) ใช้งบ Monte Carlo ที่มากกว่า (เช่น ndraw=400, nperm=24) งบ quick ที่ใช้ในเนื้อหาหลักเพื่อครอบคลุมตระกูลเคอร์เนล EFT ทั้งหมด (เช่น ndraw=60, nperm=12) ดังนั้นค่าตัวเลขสัมบูรณ์อาจมี drift จากการสุ่มระดับ O(10) อย่างไรก็ตาม การเปรียบเทียบระหว่างแบบจำลองภายในงบ/ตารางเดียวกันเป็นธรรม และเครื่องหมายกับขนาดของความได้เปรียบยังคงเสถียรข้ามงบ


B.1 วัตถุประสงค์และการวางตำแหน่ง (ทำไมต้อง P1A และทำไมอยู่ในภาคผนวก)

P1A ไม่พยายามไล่ให้หมดทุกตัวเลือกการสร้างแบบจำลองฮาโล ΛCDM (เช่น ความไม่ทรงกลม การพึ่งพาสิ่งแวดล้อม การเชื่อมต่อดาราจักร–ฮาโลที่ซับซ้อน หรือ baryon physics มิติสูง) แต่ P1A ทำตามหลัก “มิติต่ำ ตรวจสอบได้ ทำซ้ำได้”: โมดูลเสริมแต่ละชุดเพิ่มเพียงพารามิเตอร์มีผลสำคัญ ≤1 ตัว และยังอยู่ภายใต้ข้อจำกัดแข็งสามข้อของบทความนี้:
(i) บัญชีพารามิเตอร์: พารามิเตอร์ใหม่ทุกตัวต้องถูกบันทึกอย่างชัดเจนและรายงานพร้อมเกณฑ์สารสนเทศ (AICc/BIC);
(ii) การจับคู่ร่วม: ยังคงใช้แผนที่การจัดกลุ่ม RC-bin→GGL-bin เดิม; ไม่อนุญาตให้ “ปรับการจับคู่” แยกเฉพาะชุดข้อมูลเดียว;
(iii) การทดสอบปิดวงจร: การเสริมใด ๆ ต้องแสดงกำไรจริงในการพยากรณ์ถ่ายโอน RC→GGL ไม่ใช่เพียงฟิต RC-only ได้ดีขึ้น


B.2 DM 7+1 + DM_STD: นิยามโมดูล พารามิเตอร์ และการเข้าสู่โพสทีเรียร์ร่วม

ในฐานะ runpack อิสระ P1A ให้ DM workspaces 8 ชุด (DM 7+1) พร้อมตัวควบคุม EFT 1 ชุด: เริ่มจาก DM_RAZOR เป็นเส้นฐาน สร้างการเสริม legacy หนึ่งพารามิเตอร์สามรายการ (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), เพิ่มโมดูลป้องกันที่เป็นมาตรฐานขึ้นสามรายการ (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M) แล้วให้แบบจำลองรวม DM_STD เป้าหมายร่วมของโมดูลเหล่านี้คือครอบคลุมข้อวิจารณ์ที่พบบ่อยที่สุดสามประเภท พร้อมเพิ่มมิติให้น้อยที่สุด: (a) c–M scatter และ priors เข้าสู่แบบจำลองลำดับชั้นอย่างไร; (b) ผลหลักของ baryonic feedback สามารถจับด้วย core proxy หนึ่งพารามิเตอร์ได้หรือไม่; และ (c) ระบบผิดพลาดสำคัญฝั่งเลนส์อาจถูกเข้าใจผิดว่าเป็นสัญญาณฟิสิกส์ได้หรือไม่

Workspace

dm_model

พารามิเตอร์ใหม่ (≤1)

แรงจูงใจทางฟิสิกส์ (แกนกลาง)

หลักการใช้งาน (เป็นมิตรต่อการตรวจสอบ)

DM_RAZOR

NFW (fixed c–M, no scatter)

เส้นฐานฮาโล ΛCDM ขั้นต่ำที่ตรวจสอบได้; ใช้สำหรับเปรียบเทียบอย่างเข้มงวดกับ EFT

ตรึงการจับคู่ร่วม; บัญชีพารามิเตอร์เข้มงวด; ใช้เป็น baseline สำหรับการเปรียบเทียบสัมพัทธ์เท่านั้น

DM_RAZOR_SCAT

NFW + c–M scatter(legacy)

σ_logc

ความสัมพันธ์ c–M มี scatter; ประมาณด้วย log-normal scatter หนึ่งพารามิเตอร์

≤1 พารามิเตอร์ใหม่; คงการจับคู่ร่วม; ใช้กำไรด้าน closure เป็นเกณฑ์ยอมรับ

DM_RAZOR_AC

NFW + Adiabatic Contraction(legacy)

α_AC

การตกเข้าของ baryon อาจทำให้ฮาโลหดตัวแบบ adiabatic; ประมาณด้วยความแรงหนึ่งพารามิเตอร์

≤1 พารามิเตอร์ใหม่; การจับคู่ไม่เปลี่ยน; รายงานการเปลี่ยน AICc/BIC และกำไรด้าน closure

DM_RAZOR_FB

NFW + feedback core(legacy)

log r_core

feedback อาจสร้าง core ในบริเวณด้านใน; ประมาณด้วยสเกล core หนึ่งพารามิเตอร์

≤1 พารามิเตอร์ใหม่; ใช้โปรโตคอล closure/ตัวควบคุมเชิงลบเดียวกัน; การปรับปรุง RC-only ไม่ใช่เป้าหมายเดียว

DM_HIER_CMSCAT

Hierarchical c–M scatter + prior

σ_logc(hier)

โครงสร้างลำดับชั้น c_i∼logN(c(M_i),σ_logc) ที่เป็นมาตรฐานกว่า; ส่งผลต่อโพสทีเรียร์ร่วมของทั้ง RC และ GGL

แสดง prior ชัดเจน; marginalize latent c_i; ยังมิติต่ำและตรวจสอบได้

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14‑inspired)

log r_core

ใช้ core proxy หนึ่งพารามิเตอร์สำหรับผลหลักของ baryonic feedback เพื่อหลีกเลี่ยงรายละเอียดการก่อดาวมิติสูง

อ้างวรรณกรรมมาตรฐาน; ≤1 พารามิเตอร์ใหม่; ผูกกับการทดสอบ closure

DM_RAZOR_M

NFW + lensing shear‑calibration nuisance

m_shear(GGL)

ดูดซับระบบผิดพลาดสำคัญของเลนส์ความโน้มถ่วงอ่อนด้วยพารามิเตอร์มีผลหนึ่งตัว ลดความเสี่ยงในการเข้าใจระบบผิดพลาดผิดว่าเป็นฟิสิกส์

บันทึก nuisance อย่างชัดเจน; ไม่สามารถส่งผลย้อนกลับต่อ RC; ตัดสินผลลัพธ์หลักจากความทนทานของ closure

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

รวมข้อวิจารณ์ที่พบบ่อยที่สุดสามกลุ่มไว้ในเส้นฐานมาตรฐานที่ยังมีมิติต่ำ

รายงานบัญชีพารามิเตอร์ + เกณฑ์สารสนเทศ; closure เป็นตัวชี้วัดหลัก; ใช้เป็นตัวควบคุมป้องกัน DM ที่แข็งแรงที่สุด

หมายเหตุ: ชื่อพารามิเตอร์ข้างต้นตามการใช้งานเชิงวิศวกรรม (เช่น σ_logc, α_AC, log r_core และ m_shear) จุดเน้นของการออกแบบ P1A คือ “ทำให้เส้นฐาน DM แข็งแรงขึ้นบ้างพร้อมยังตรวจสอบได้” ไม่ใช่เปลี่ยนฝั่ง DM ให้เป็นเครื่องฟิตมิติสูงที่ควบคุมไม่ได้ โดยเฉพาะ DM_HIER_CMSCAT ใส่ c–M scatter แบบลำดับชั้น: กำหนดความเข้มข้น c_i ของฮาโลแต่ละตัวให้มี scatter แบบ log-normal รอบ c(M_i) และถูกจำกัดด้วย σ_logc ระดับโลกและ c(M) prior; โครงสร้างลำดับชั้นนี้ส่งผลต่อโพสทีเรียร์ร่วมของทั้ง RC และ GGL


B.3 โปรโตคอลสถิติและแบบแผนผลิตภัณฑ์ที่สอดคล้องกับเนื้อหาหลัก

P1A ใช้ผลิตภัณฑ์ข้อมูลทั้งหมด การจับคู่ร่วม และกรอบการตรวจสอบจากเนื้อหาหลักซ้ำ ลำดับการดำเนินงานและแบบแผนผลิตภัณฑ์ยังคงสอดคล้องกัน:
(1) Run‑1: การอนุมาน RC-only (ส่งออก posterior_samples.npz และ metrics.json);
(2) Run‑2: การทดสอบปิดวงจร RC→GGL (ส่งออก closure_summary.json และ permuted baseline);
(3) Run‑3: การฟิตร่วม RC+GGL (ส่งออก joint_summary.json)
ค่าตัวเลขทั้งหมดที่อ้างมาจากตารางที่คอมไพล์อัตโนมัติ (Tab_S1_P1A_scoreboard) และสามารถตรวจได้หลังรันเวิร์กโฟลว์ P1A เต็มรูปแบบซ้ำ โดยใช้สคริปต์เปรียบเทียบตารางอ้างอิงที่ฝังอยู่ใน P1A full_fit_runpack


B.4 ผลลัพธ์หลัก จุดเข้าตาราง/รูป และแผนคลัง (DOI เดียวกัน)

หัวข้อนี้ให้ข้อสรุปเชิงปริมาณแกนกลางของ P1A ตาราง B1 สรุปตัวชี้วัดสำคัญสำหรับ RC-only, RC→GGL closure และการฟิตร่วม RC+GGL (วงเล็บแสดงความต่างเมื่อเทียบกับเส้นฐาน DM_RAZOR) ความแรงการปิดวงจรถูกนิยามเป็น ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (ยิ่งสูงยิ่งดี) รูป B1 แสดง scoreboard เดียวกันเป็นภาพ ประเด็นหลักมีดังนี้:
• ในสามกิ่ง legacy มีเพียง DM_RAZOR_FB (feedback/core) ที่ให้การปรับปรุงสุทธิเล็กน้อยในความแรงการปิดวงจร: 122.21→129.45 (+7.25); SCAT และ AC ไม่ให้การปรับปรุงสุทธิ;
• DM_HIER_CMSCAT และ DM_RAZOR_M ที่เพิ่มใหม่มีผลเล็กมาก (~0) ต่อความแรงการปิดวงจร และ DM_CORE1P ก็ไม่แสดงการปรับปรุงสุทธิอย่างมีนัยสำคัญเช่นกัน;
• แบบจำลองรวม DM_STD สามารถปรับปรุง joint logL ได้มาก (เข้าใกล้ optimum ของการฟิตร่วมมากขึ้น) แต่ความแรงการปิดวงจรลดลง บ่งชี้ว่ากำไรหลักมาจากความยืดหยุ่นในการฟิตร่วมมากกว่าการถ่ายโอนข้ามโพรบ;
• ในฐานะตัวควบคุม EFT_BIN ยังรักษาความได้เปรียบชัดเจนทั้งด้านความแรงการปิดวงจรและการฟิตร่วม ดังนั้นข้อสรุปหลักจึงทนทานต่อการนำ “เส้นฐาน DM ที่แข็งแรงขึ้น + nuisance ฝั่งเลนส์” เข้ามา

เพื่อเปรียบเทียบโดยตรงกับผลลัพธ์ในเนื้อหาหลัก ตาราง S1a–S1b สรุปการเปรียบเทียบแบบ strict ระหว่างตระกูล EFT กับ DM_RAZOR: แบบจำลอง EFT ปรับปรุงการฟิตร่วมด้วย ΔlogL_total≈1155–1337 เมื่อเทียบกับ DM_RAZOR และถึง ΔlogL_closure=172–281 ในการทดสอบปิดวงจร P1A เพียงสร้าง “ตัวควบคุมที่ยากขึ้น” ฝั่ง DM; จุดประสงค์คือเพื่อลดข้อกังวลเช่น “เส้นฐานหุ่นฟาง” หรือ “ระบบผิดพลาดถูกถือเป็นฟิสิกส์” ไม่ใช่เพื่อแทนที่การเปรียบเทียบหลัก

ตาราง B1 | scoreboard ของ P1A (ยิ่งสูงยิ่งดี; วงเล็บแสดงความต่างเมื่อเทียบกับเส้นฐาน DM_RAZOR)

กิ่งแบบจำลอง (workspace)

Δk

RC-only best logL_RC (Δ)

ความแรง closure ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

รูป B1 | scoreboard ของ P1A: closure และ joint ΔlogL เมื่อเทียบกับ baseline (ยิ่งสูงยิ่งดี)

แท็กตัวอย่างสำหรับชุดการรันที่เสร็จสมบูรณ์ซึ่งสอดคล้องกับภาคผนวกนี้มีดังนี้ (ใช้ระบุตำแหน่งผลิตภัณฑ์กลางและตาราง/รูปของ P1A):
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428


B.5 ข้อเสนอแนะการอ้างอิง (หมายเหตุการอ้างอิงภาคผนวก)

เมื่อผู้อ่านต้องการอ้าง “การทดสอบแรงกดดันเพื่อทำให้เส้นฐาน DM เป็นมาตรฐาน” เพิ่มจากข้อสรุปหลักของบทความ แนะนำให้อ้างข้อสรุปหลักพร้อมหมายเหตุว่า: “See Appendix B (P1A) for standardized DM-baseline stress tests (legacy SCAT/AC/FB + hierarchical c–M scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.”