หน้าเว็บ

วันเสาร์ที่ 3 มีนาคม พ.ศ. 2555

วิเคราะห์ข้อมูลด้วย Data Mining


วิเคราะห์ข้อมูลด้วย Data Mining

การวิเคราะห์พฤติกรรมลูกค้า โดยอาศัยเงื่อนไขเกี่ยวกับจิตวิทยาผู้บริโภคที่ยกตัวอย่างมาข้างตน ดดยปกติมักจะเป็นเรื่องที่นักการตลาดของแต่ละหน่วยงานจะต้องมานักพินิจพิเคราะห์กันเอาเอง  แต่เมื่อระบบ Data Mining ได้ถูกพัฒนาขึ้นมา มันก็ถูกนำมาใช้แทนที่แรงงานสมองของมนุษย์ ได้อย่างเหมาะเจาะลงตัว โดยมันจะจัดการวิเคราะห์รูปแบบ (pattern) แล้วจัดกลุ่มข้อมูล (cluster) ของลูกค้าที่ผ่านเข้ามาทางเว็บไซต์ให้อย่างอัตโนมัติ มีการซอยย่อยประเภทของลุกค้าออกเป็นหลายๆรูปแบบด้วยเงื่อนไขต่างๆกัน เพื่อแสวงหาความคล้ายคลึงกันระหว่างลูกค้าเหล่านั้น และเพื่อให้ผู้บริหารเว็บไซต์สามารถกำหนดรูปแบบการนำเสนอสินค้า และการประชาสัมพันธ์องค์กร ซึ่งจะเหมาะสมตรงใจลุกค้ากลุ่มเป้าหมายมากที่สุด อันจะส่งผลให้ลูกค้ากลุ่มนี้เกิดติดอกติดใจ (loyalty) และย้อนกลับมาเป็นลูกค้าขาประจำในที่สุด
พื้นฐานการทำงานหลักของระบบ Data Mining ประกอบไปด้วย 2 ส่วนสำคัญ คือ กระบวนการวิเคราะห์ทางสถิติ (statistics) และเทคโนโลยีปัญญาประดิษฐ์ (Artificial Intelligence) ซึ่งเรียนแบบกระบวนการความรู้ของมนุษย์ที่หลายคนนิยมเรียกว่า เป็นการเรียนรู้ของเครื่องจักร (machine-learning) กระนั้นก็ดี มีความพยายามนำเอารูปแบบการทำงานของ Data Mining ไปเปรียบเทียบกับกลุ่มโปรแกรมจัดการฐานข้อมูล และระบุว่าการทำงานของ Data Mining ไปเปรียบเทียบกับกลุ่มโปรแกรมจัดการฐานข้อมูล และระบุว่าการทำงานของ Data Mining นั้น ไม่เห็นจะมีอะไรโดดเด่นเป็นพิเศษเลย แค่เป็นการจับโน่นมานิดจับนี้มาหน่อย จากบรรดาโปรแกรมจัดการฐานข้อมูลที่มีๆใช้งานอยู่แล้ว ไม่ว่าจะเป็น database query program, report generators, และ statistical packages ฯลฯ
อย่างไรก็ตาม นั่นกลับยิ่งเป็นการแสดงให้เห็นประสิทธิภาพของโปรแกรม Data Mining ให้เห็นชัดแจ้งยิ่งขึ้นในฐานะที่มันสามารถเรียนรู้และดึงเอารูปแบบการจัดการฐานข้อมูลลักษณะต่างๆ ที่ได้รับความนิยมใช้งานอยู่โดยทั่วไปอยู่แล้ว มาประยุกต์ใช้ร่วมกันได้อย่างอัตโนมัติ แถมยังจัดแจงสรุปผลลัพธ์ออกมาในรูปภาษาอังกฤษตามมาตรฐานไวยากรณ์ที่มนุษย์มนาทั่วๆไปรู้จักคุ้นเคยกันเป็นอย่างดีอยู่แล้ว ผู้ใช้โปรแกรม Data Mining จึงไม่จำเป็นต้องมานั่งกำหนดรูปแบบเงื่อนไขการวิเคราะห์ให้ยุ่งยากปวดสมองและเมื่อได้ผลวิเคราะห์ออกมาก็สามารถนำไปใช้งานต่อได้ทันที ตัวอย่างง่ายๆ ของข้อมูลที่เราอาจจะได้จากการวิเคราะห์ของโปรแกรม Data Mining ก็เช่น
ถ้าหาก มีลูกค้ากลุ่มหนึ่งใช้บริการขององค์กรมาตั้งแต่ ค.ศ. 1994 และเป็นลูกค้าที่มีเครดิตชำระด้วยระบบเงินเชื่อระหว่าง $1500-$3300 มันก็มีความเป็นไปได้สูงที่ลูกค้ากลุ่มนี้น่าจะซื้อสินค้าจากองค์กรของเราได้ในเกณฑ์ $900
ผลวิเคราะห์ทำนองนี้ แม้ว่าจะดูง่ายๆ แต่อย่าลืมว่ามันมิได้เป็นรูปแบบเดียวที่โปรแกรม Data Mining สามารถวิเคราะห์ได้ มันเป็นเพียงหนึ่งในร้อยหนึ่งในพันของรูปแบบวิเคราะห์ที่โปรแกรมดึงมาเปรียบเทียบข้อมูลจำนวนมหาศาลในฐานข้อมูล โดยอัลกอริทึมหลักๆที่มีการนำมาประยุกต์ใช้กับโปรแกรม Data Mining นั้น ได้แก่ CART, CHAD, ID3, และ C4.5 ฯลฯ สมมติง่ายๆ เหมือนว่าเรามีข้อมูลอยู่เพียงสองประเภทในฐานข้อมูล เป็นข้อมูลลูกค้าแทนด้วยอักษร c และข้อมูลของผู้ที่มิใช่ลูกค้าแทนที่ด้วยตัวอักษร n วางกระจัดกระจายอยู่บนโต๊ะ เจ้าแรแกรม Data mining ก็จะเข้ามาจัดแบ่งกลุ่มข้อมูลเหล่านี้ออกเป็นกลุ่มย่อยๆ ซึ่งมีรูปแบบการจัดวางลักษณะเดียวกัน โดยอาจจะรองวางกรอบกลุ่มย่อยเหล่านี้ในลักษณะต่างๆ เช่น ลองใช้กรอบสามเหลี่ยมสี่เหลี่ยมผืนผ้าบ้าง จัตุรัส วงกลมหรือวงรีบ้างตามแต่ความเหมาะสม
ผลการศึกษาเปรียบเทียบรูปแบบที่คล้ายคลึงกันระหว่างข้อมูลลูกค้า และผู้เข้าเยี่ยมชมเว็บไซต์ด้วยอัลกอริทึมหลายๆลักษณะ เช่น จากผลการวิเคราะห์ด้วยเงื่อนไขดังนี้
IF ZIP CODE (93011-94123)
AND REGISTRATION NO.(0051-0943)
AND USER ID NO. (4566jk33-4558dl01)
THEN /WEBSELL/PRODUCT8.HTM 87%
โปรแกรม Data Mining ก็อาจจะสรุปมาให้เสร็จสรรพเลยว่า ในบรรดาผู้สมัครสมาชิกกับเว็บไซต์จำนวนเกือบเก้าร้อยคน (Reg NO 0051-0943) ซึ่งมีที่อยู่อาศัยในเขตไปรษณีย์ 93011-94123 ของมลรัฐแคลิฟอร์เนียนั้นกว่า 87% จะต้องแวะเวียนเข้าไปที่เว็บเพจดังกล่าว ต้องมีสิ่งดึงดูดใจลูกค้าเหล่านี้มากพอสมควรทีเดียว ฉะนั้น หากจะมีการปรับปรุงดีไซต์รูปแบบของเว็บไซต์ใหม่ ก็อาจจะนำเอาจุดเด่นดังกล่าวมาใช้ในการออกแบบด้วย หรือหากไม่ต้องการปรับปรุงอะไรมาก ผู้ควบคุมเว็บไซต์ก็ควรจะหาทางใช้ประโยชน์ข้อสรุปที่ได้จาก Data mining  ให้มากที่สุด ทำนองว่าอยากจะโฆษณาประชาสัมพันธ์อะไรไปสู่ลูกค้าในเขตพื้นที่รหัสไปรษณีย์ 93011-94123 ก็เห็นจะต้องใช้เว็บเพจ produc8.htm นี่แหละ
นอกจากนั้นระบบ Data mining ยังเปิดโอกาสให้มีการเปรียบเทียบข้อมูลระหว่างเพจต่อเพจได้อีกด้วย  เช่น อาจจะยกข้อมูลจากเว็บเพจ produc8.htm ที่ได้กล่าวมาข้างต้น ไปเปรียบเทียบกับข้อมูลจากเว็บเพจ produc5.htm และเว็บเพจ order_form.htm ต่อไปอีก ซึ่งก็จะทำให้ได้ผลลัพธ์ที่ยิ่งน่าสนใจขึ้นไปอีก โดยเฉพาะข้อมูลจากเว็บเพจ order_form.htm นั้น บอกให้ผู้บริหารเว็บไซต์รู้ได้อย่างชัดเจนว่ามีผู้เยี่ยมชมเว็บไซต์ผ่านเพจ produc8.htm ถึงกว่า 83% ซึ่งตกลงปลงใจซื้อหาบริการจากหน่วยงานของเราในที่สุด โดยอาศัยแบบฟอร์มสั่งซื้อสินค้าที่บรรจุอยู่ในเพจ order_form.htm ดังรายละเอียดต่อไปนี้
                IF ZIP CODE (93001 - 94123)
                AND REGISTRATION NO. (0051-0943)
                AND PRIOR PAGE /WEBSELL/PRODUCT8.HTM
THEN /WEBSELL/PRODUCT5.HTM 73%

และ
IF ZIP CODE (93011-94123)
AND REGISTERATION NO. (0051-0943)
AND PRIOR PAGE /WEBSELL/PRODUCT8.HTM
THEN /WEBSELL/ORDER_FORM.HTM 83%

ไม่มีความคิดเห็น:

แสดงความคิดเห็น