บันทึก training data science EP 14 END - Data scientist ก็เคยทำพลาดนะ
ตอนก่อนหน้า: บันทึก training data science EP 13: Regularization – Optimization ด้วย Regularization
class สุดท้ายของ training ผมก็ต้องขอขอบคุณ Mr.James Larkin, Mr. Greg Baker, Mr. Attapol Thamrongrattanarit ฮะ ที่เสียสละเวลามาสอนผมและเพื่อนๆ จากไม่มีพื้นฐานอะไรเลย จนสามารถทำ basic data analysis ได้ฮะ
และนี่คือคำแนะนำจาก Mr. Larkin ถึงความผิดพลาดบ่อยๆ ที่ Data scientist มักจะเจอเป็นประจำฮะ
คำถาม
Data scientists มักจะทำผิดพลาดเรื่องอะไรได้บ้าง
Mr. Larkin ตอบ
ก็โดยทั่วๆ ไป ความผิดพลาดมักจะเกิดจากการไม่ชำนาญ ทำงานที่ตัวเองยังใหม่กับด้านนั้น แต่บางกรณีก็เกิดจากสภาพแวดล้อมและความซับซ้อนของปัญหานั้นๆ เองด้วย ถ้าจะอธิบายก็มีประมาณนี้
- สนใจ algorithm มากกว่าตัวข้อมูลเอง
หน้าที่ของเราคือการค้นหา insight ที่ซ่อนในเนื้อข้อมูล ดังนั้นจึงควรให้ความสำคัญกับข้อมูลมากกว่า แต่ทั้งนี้การทำงานให้สำเร็จก็สำคัญเหมือนกันนะ - เลือกใช้ algorithm ไม่ถูกกับงาน
หลายๆ ครั้งที่พวกเรา Data scientists อยากจะลองใช้ algorithm ใหม่ๆ ที่ดูแววแล้วน่าจะเหมาะกับงานนี้ หรือจะลองใช้ method ที่ดูเหมือนว่าจะตอบโจทย์ (แต่บางที มันคือ black box ที่เราไม่เห็นการทำงานข้างในนะ)
จริงๆ แล้วเราควรจะมองหา algorithm ที่ไม่ต้องใหม่ที่สุด ดีที่สุด แต่เหมาะกับข้อมูลที่เกี่ยวข้องกับงานนี้นะ - ไม่เข้าใจข้อมูลเพียงพอ
data exploring, data cleansing และ data visualizing เนี่ยถือเป็นสเตปแรกของ data science เลยนะ ถ้าเรายังไม่ชัดเจนกับข้อมูลว่ามันเป็นไปยังไง มีจุดไหนที่ต้องเช็ค หรือต้องระวัง เราจะพลาดกันได้ง่ายๆ ประเด็นนี้เป็นข้อผิดพลาดหลักๆ ของเราทีเดียว - ยึดติดกับประสบการณ์เก่าๆ มากเกินไป
ประสบการณ์เป็นเรื่องดี แต่การยึดติดกับประสบการณ์มากเกินไปเพื่อตัดสินใจเกี่ยวกับงานอาจจะไม่ใช่เรื่องดี เพราะงานของ Data scientists ขึ้นอยู่กับข้อมูลที่เปลี่ยนแปลงไปได้ตลอดเวลา จึงต้องยืดหยุ่นไปตามงานด้วย - การสื่อสารกันในทีม
ปัญหาที่เจอกันไม่น้อย ไม่ใช่การคำนวณผิดพลาด หรือสร้าง model ไม่ได้ แต่เป็นประเด็นที่ทำงานออกมาได้ดี สร้าง insight เยี่ยม แต่กลับนำเสนอ และสื่อสารมันออกไปได้ไม่ชัดเจน หรือไม่สื่อถึงจุดประสงค์จริงๆ นี่จึงเป็นอีกสิ่งที่ต้องใส่ใจ
เป็นคำแนะนำที่มีประโยชน์ และบางข้อเนี่ยสามารถใช้ในงานด้านอื่นได้ด้วยฮะ
และจบไปแล้วกับซีรี่ส์นี้ บล็อกถัดไปจะเป็นอะไร จะเก็บมาเล่าให้อ่านกันนะฮะ