หากเรามีข้อมูลมากมายไปหมด วิธีการที่ง่ายที่สุดในการหา Insight หรือสื่อสารจากข้อมูลก็คือการทำ Data Visualization แต่เราเลือกกราฟหรือแผนภาพอย่างไร?
Big Data
หนึ่งในขั้นตอนของการวิเคราะห์ข้อมูลที่สำคัญคือการสำรวจและตรวจสอบข้อมูลเบื้องต้น อาทิ ข้อมูลเป็นข้อมูลประเภทไหน ข้อมูลมีการกระจายตัวเป็นอย่างไร แต่ละตัวแปรมีความสัมพันธ์อย่างไรเทียบกับข้อมูลทั้งหมด เพราะจะช่วยทำให้การตั้งสมมุติฐานของโจทย์ที่ต้องการวิเคราะห์ได้ดีขึ้น ซึ่งปกติแล้วจะนำข้อมูลมาแสดงผลในรูปแบบของภาพนิทัศน์ (visualization) เช่น แผนภูมิแท่ง (bar chart), แผนภูมิเส้น (line chart), แผนภูมิจุด (scatter plot) เป็นต้น สำหรับเครื่องมือการสร้างแผนภูมิใน
จะทำอย่างไรถ้าต้องทำ Project Data Science ที่ต้องพัฒนากันทั้งในหลาย Environment หลาย Version มาทำความรู้จักกับปลาวาฬสีฟ้า เจ้า Docker ที่จะมาแก้ปัญหาเหล่านี้
ในบทความนี้ เราจะมาลองติดตั้ง Data Catalog เพื่อทดลองใช้งานกัน โดยใช้ CKAN ซึ่งเป็น Open source สำหรับการทำ Open Data Portal ที่ถูกใช้โดยรัฐบาลและหน่วยงานมากมายทั่วโลก
บทความที่แล้ว เราได้พาท่านผู้อ่านไปรู้จักกับ Survival Analysis ในเบื้องต้นว่าคืออะไร พร้อมกับกรณีตัวอย่างการประยุกต์ใช้ นอกจากนี้ผู้อ่านก็ได้ทำความรู้จักกับ Censored Data ประเภทต่าง ๆ กันมาแล้ว ถ้าใครยังไม่รู้จัก Survival Analysis กับ Censored Data แนะนำให้เข้าไปอ่านบทความแรกก่อนใน Survival
ทำความรู้จักกับกรอบการวิเคราะห์ข้อมูลขนาดใหญ่ภาครัฐ (Government Big Data Analytics Framework) ประเทศไทย