ทำไมช่วงนี้เว็บโปรดเราล่มบ่อยจัง? (สปอยล์: ไม่ใช่แค่คุณคนเดียวที่เจอครับ)

 

ช่วงนี้ใครรู้สึกว่าเข้าเว็บหรือแอปฯ ประจำไม่ได้บ้างครับ? บอกเลยว่าไม่ได้คิดไปเอง

ล่าสุดเมื่อวันอังคารที่ผ่านมา Cloudflare ผู้ให้บริการโครงสร้างพื้นฐานเบื้องหลังอินเทอร์เน็ตรายใหญ่เจอปัญหาขัดข้อง ทำให้บริการออนไลน์ดังๆ ตั้งแต่ Spotify ยัน ChatGPT (หรือแม้แต่ Truth Social ของโดนัลด์ ทรัมป์) ใช้งานไม่ได้ชั่วคราว นับเป็นอีกเหตุการณ์ "เน็ตล่ม" ระดับโลกที่เกิดขึ้นติดๆ กัน

ถ้าย้อนไปเมื่อเดือนก่อน Amazon Web Services (AWS) ก็เพิ่งทำพิษ กระทบชีวิตประจำวันของคนนับล้าน บางคนถึงขั้นสั่งกาแฟไม่ได้ หรือคุมเครื่องใช้ไฟฟ้าในบ้านผ่านระบบ Smart Home ไม่ได้ และคล้อยหลังไม่กี่วัน Microsoft Azure ก็เจอล่มตามไปติดๆ

ผู้เชี่ยวชาญมองว่า นี่คือ "สัญญาณแห่งยุคสมัย" ครับ มันเกิดจากการที่เราพึ่งพาบริการดิจิทัลกันหนักมาก บวกกับการที่โครงสร้างพื้นฐานคลาวด์สำคัญๆ ไปกระจุกตัวอยู่กับบริษัทแค่ไม่กี่เจ้า และแน่นอน... นิสัยของชาวเน็ตที่พร้อมใจกันบ่นทันทีเมื่อเทคโนโลยีมีปัญหา

สิ่งนี้เตือนใจเราว่า "ไม่มีใครรอด" แม้แต่บริษัทยักษ์ใหญ่ระดับโลก Eileen Haggerty ผู้บริหารจาก Netscout บริษัทด้านความปลอดภัยไซเบอร์ถึงกับบอกว่า เรื่องระบบล่มพวกนี้เป็น "ปัญหาที่ธรรมดามากๆ"

เจาะลึก: เกิดอะไรขึ้นที่ Cloudflare?

Cloudflare ออกมาชี้แจงกับ CNN ชัดเจนครับว่า "ไม่ใช่การโจมตีทางไซเบอร์" แต่เป็นปัญหาทางเทคนิค สาเหตุเกิดจาก "ไฟล์การตั้งค่า" (Configuration file) ที่เอาไว้จัดการทราฟฟิกภัยคุกคาม ไฟล์นี้ดันมีขนาดใหญ่เกินกว่าที่คาดไว้ จนไปทำให้ซอฟต์แวร์จัดการทราฟฟิกแครช (Crash)

Dane Knecht, CTO ของ Cloudflare โพสต์อธิบายเพิ่มเติมว่า มันเกิดจากบั๊กในการเปลี่ยนค่า Config ตามปกติ แล้วลามเป็นลูกโซ่ (Cascaded) ไปทั่วเครือข่าย ซึ่งคล้ายกับเคสของ Amazon ก่อนหน้านี้ ที่ระบบอัตโนมัติสองตัวพยายามจะอัปเดตข้อมูลเดียวกันพร้อมกันจนระบบรวน

หรือว่าเราแค่พึ่งพามันมากเกินไป?

Mike Chapple ศาสตราจารย์ด้านไอทีให้มุมมองที่น่าสนใจครับว่า ถ้าเป็นเมื่อ 20 ปีก่อน ระบบไอทีล่มเป็นเรื่องที่เจอได้ "ตลอดเวลา" แทบจะทุกสัปดาห์ แต่สมัยนี้พอเราฝากชีวิตไว้กับยักษ์ใหญ่อย่าง Amazon, Microsoft และ Google ซึ่งเป็นเหมือน กระดูกสันหลังของเว็บ (Backbone of the web) พอมันล่มทีนึง แรงกระเพื่อมมันเลยมหาศาล

  • Downdetector ได้รับรายงานปัญหาพุ่งไปกว่า 2.1 ล้านครั้งในวันเดียว
  • Cloudflare ปกติต้องจัดการคำขอข้อมูล (HTTP requests) ถึง 81 ล้านครั้งต่อวินาที!

สรุปแล้ว... มันล่มบ่อยขึ้นจริงไหม?

การที่ล่มใหญ่ 3 ครั้งในเดือนเดียวอาจเป็นเรื่องบังเอิญครับ ข้อมูลจาก Cisco ThousandEyes ระบุว่า จำนวนครั้งที่ระบบล่มนั้น "ยังคงสม่ำเสมอ" ไม่ได้เพิ่มขึ้นแบบมีนัยสำคัญ แต่สิ่งที่เปลี่ยนไปคือ "จำนวนแอปฯ และเว็บที่ผูกติดกับบริการเหล่านี้มันเยอะขึ้น" ผลกระทบเลยดูกว้างขวางและรุนแรงกว่าเดิม

สถิติการล่มครั้งใหญ่ (Major outages) จาก Cisco:

  • ปี 2025 (นับถึงตอนนี้): 12 ครั้ง (ไม่รวมเคส Cloudflare ล่าสุด)
  • ปี 2024: 23 ครั้ง (รวมเคส Crowdstrike ที่ป่วนสนามบินและโรงพยาบาลทั่วโลก)
  • ปี 2023: 13 ครั้ง

แนวโน้มในปี 2025 ที่ Cisco พบคือ มักเกิดจากระบบที่ "ดูเหมือนจะทำงานปกติ" แต่มีปัญหาซ่อนอยู่ หรือการเปลี่ยนค่า Config แล้วพังกันเป็นโดมิโน

สุดท้าย ผู้เชี่ยวชาญฝากไว้ให้คิดครับว่า เรื่องพวกนี้ "จะเกิดขึ้นอีกแน่นอน" และไม่มีธุรกิจไหนพูดได้เต็มปากว่า "โชคดีจัง เรื่องแบบนี้คงไม่เกิดกับเรา" เพราะความจริงคือ มันเกิดขึ้นได้กับทุกคนครับ

#DRKRIT drkrit.com #กระแสไอที #ข่าวไอที #ไทยสมาร์ทซิตี้