Blognone รายงานข่าวเรื่อง Big Data มาพอสมควร พอดีเมื่อวันก่อน Dell ประเทศไทยมีแถลงข่าวเรื่อง Storage + Big Data (ซึ่งเป็นเรื่องที่เกี่ยวข้องกัน) ผมเลยไปฟังหน่อยเผื่อว่าจะได้ภาพรวมของตลาด Big Data ในประเทศไทยนะครับ
การนำเสนอของ Dell เริ่มจากโชว์คำพยากรณ์ของ Gartner ที่ประเมินว่าอัตราการเติบโตของข้อมูลในองค์กรจะเติบ โตสูงมากในอนาคต ตัวเลขปีล่าสุดคือ 47 เท่าในปี 2011 (ข้อมูลที่สร้างในปี 2011 คิดเป็น 1.8 ล้านล้าน GB)
ในแง่การเก็บข้อมูลระดับคอนซูเมอร์ก็เรื่องนึง แต่ในระดับองค์กร ต่อไปความสามารถในการนำข้อมูลมาใช้งานจะเป็นตัวชี้วั ดความสามารถในการแข่งขันขององค์กรได้ องค์กรไหนที่นำข้อมูล (ที่มีอยู่แล้ว) มาสกัดออกเป็นยุทธศาสตร์ได้ก็จะประสบความสำเร็จ

การจัดเก็บข้อมูลจะยากและซับซ้อนขึ้นเรื่อยๆ เพราะก่อนหน้านี้เราไม่เคยออกแบบระบบเก็บข้อมูลที่มั นใหญ่ขนาดนี้ (ไม่มีใครเคยคิดถึงสเกลระดับนี้มาก่อน) ในระบบ enterprise storage แบบเก่าต้องการบำรุงรักษาเยอะ เช่น

  • ต้องทำ forklift หรือยกข้อมูลเก่าทิ้ง ซึ่งเสียเวลา downtime
  • storage แบบเดิมจะเก็บแยกส่วนตามโครงสร้างองค์กร (silo) ต่างคนต่างเก็บ แชร์ทรัพยากรร่วมกันไม่ได้ อีกฝั่งมีเนื้อที่เหลือย้ายข้ามไปใช้ลำบาก
  • storage แบบเดิมไม่เคยคิดเรื่อง virtualization และ virtual machine จึงตามไม่ทันเทคโนโลยีของฝั่งเซิร์ฟเวอร์
  • ออกแบบระบบโดยกำหนดโควต้าพื้นที่ให้ผู้ใช้แบบตายตัว ระบบ storage ไม่สามารถคิดเองได้ว่าจะปรับเนื้อที่ได้อย่างไร การลงทุนเลยไม่มีประสิทธิภาพ


Dell แบ่งระดับของ storage องค์กรออกเป็น 5 ระดับ ตามภาพ

  1. Choas หรือไม่ได้เก็บข้อมูลอะไรอย่างเป็นระเบียบเลย
  2. Retention เก็บข้อมูลตามปกติ
  3. Optimized เก็บข้อมูลและปรับแต่งให้มีประสิทธิภาพดี
  4. Simple Analytics นำข้อมูลมาวิเคราะห์ในขั้นต้น
  5. Complex Analytics วิเคราะห์ข้อมูลในระดับสูง


เส้นแบ่งอยู่ที่ระดับ 3 และ 4 ครับ โดยช่วง 1-3 คือเทคโนโลยีด้าน storage (กรอบบน) ส่วนช่วง 4-5 คือระดับของ Big Data (กรอบล่าง)
Storage

ผลิตภัณฑ์ storage ของ Dell จับตลาดนี้เป็นหลัก มีเทคโนโลยีด้าน storage ใหม่ๆ หลายอย่าง เช่น virtualization, disaster recovery, data retention, data governance (การเก็บข้อมูลตามมาตรฐานที่ระบุ)

ผลิตภัณฑ์กลุ่มนี้ออกแบบโดยใช้แนวคิด Fluid Data Architecture (FDA) มีแนวคิดสำคัญ 3 ข้อย่อยคือ

  • maximum efficiency ลดค่าใช้จ่ายของการเก็บข้อมูล (Dell อ้างว่าลดได้สูงสุด 80%)
  • greater agility การเข้าถึงข้อมูลที่รวดเร็ว และปรับโครงสร้างของข้อมูลได้ตลอดเวลา
  • guarantee resiliency เรื่องความยืดหยุ่นและเสถียรภาพของระบบ (99.999%)


ส่วนสายผลิตภัณฑ์ก็ดูกันเองตามภาพครับ (อันนี้เป็นข่าวไม่ใช่ advertorial :D)
Dell บอกว่าในอนาคตระบบ storage ควรจะฉลาดกว่านี้ เช่น ปัจจุบันเราเก็บรูปภาพและไฟล์เอกสารที่มีรูปภาพฝังอย ู่ภายในแยกกัน แต่ในอนาคตมันควรแยกแยะได้ว่าไฟล์รูปเป็นไฟล์เดียวกั น แล้วเก็บแค่ก็อปปี้เดียวเพื่อประหยัดเนื้อที่

Big Data

ในส่วนของการนำข้อมูลจำนวนมหาศาลมาวิเคราะห์ Dell (และจริงๆ ก็บริษัทอื่นด้วย) เลือกใช้เทคโนโลยี Hadoop ตามสมัยนิยม โดยจับมือกับบริษัท Cloudera ซึ่งเป็นผู้เชี่ยวชาญ Hadoop ที่กำลังมาแรง ขายเป็นโซลูชันร่วมกัน ซึ่งทาง Dell จะพัฒนาผลิตภัณฑ์ที่อยู่บนระบบ storage ของตัวเองชื่อ Crowbar เอาไว้เชื่อมกับซอฟต์แวร์ของ Cloudera อีกทีหนึ่ง
Dell ยังไม่มีผลิตภัณฑ์ด้านการวิเคราะห์ข้อมูลระดับสูง (business analytics) มากนัก ในเบื้องต้นจึงเน้นเป็นตัวกลางระหว่างการเก็บข้อมูลไ ปสู่การวิเคราะห์ข้อมูลมากกว่า
Dell ประเมินว่าในบ้านเรากำลังเริ่มสนใจ Big Data และอีกประมาณ 2 ปีเทรนด์น่าจะชัดเจนขึ้น (เหมือนกับ virtualization ที่ตอนแรกๆ คนยังงงๆ ว่ามันเอาไว้ทำอะไร) โดยอุตสาหกรรมของบ้านเราที่น่าจะใช้ก่อนคือ ธนาคารและการเงิน โทรคมนาคม และสุขภาพ ส่วนภาคการผลิตยังไม่ค่อยสนใจเท่าที่ควร
สำรหับนิยามของ Big Data ของ Dell คือขนาดข้อมูลองค์กรควรมากกว่า 8-10 TB ขึ้นไป และรูปแบบข้อมูลต้องหลากหลาย ถ้ามีแต่ relational database อย่างเดียวก็ยังไม่ต้องถึงขั้นใช้เทคโนโลยี Big Data ครับ

รูปสุดท้ายนี่ผมชอบเพราะมันให้ภาพรวมของการเก็บ storage ในระดับต่างๆ ได้ดี เลยขอสไลด์เขามาลงให้ดูด้วย


More...