Songphon's profileSongphon's amusing blog.PhotosBlogListsMore Tools Help

Blog


    10/13/2009

    ความแตกต่างระหว่างมนุษย์และเครื่องจักรในการประมวลบทสนทนา(Discourse processing)

    “บนโต๊ะมีหนังสือเล่มหนึ่ง”

    มนุษย์: หนังสืออะไร? ของใคร? โต๊ะตัวไหน? สีอะไร? แล้วยังไง? โต๊ะมีเก้าอี้ไหม? อยู่ในห้องอะไร? หนังสือเก่าไหม? หนังสือเปิดหรือปิดอยู่?

    เครื่องจักร: หนังสือเล่มหนึ่งสมมติว่าชื่อ a วางอยู่บนโต๊ะสมมติว่าชื่อ b สรุป a อยู่บน b.

    -----------------------------------------------------------------------------------------

    “ไอ้ปื้ดหิวข้าวมาก ปวดท้องจะตายอยู่แล้ว”

    มนุษย์: ทำไมปื้ดหิวข้าว –> ปื้ดไม่ได้กินข้าว, ทำไมปื้ดปวดท้อง –> เพราะว่าหิวข้าวและไม่ได้กินข้าว, ปื้ดอาจเป็นโรคกระเพาะ, หรือว่าปื้ดเป็นผู้หญิง? –> ปวดประจำเดือน? --> ถ้าปื้ดเป็นชายทำไมปวดประจำเดือนไม่ได้?, ปื้ดอยากเข้าห้องน้ำ –> ปวดขี้?

    เครื่องจักร: ทำไมปื้ดหิวข้าว –> ปื้ดไม่ได้กินข้าว, ทำไมปื้ดปวดท้อง –> เพราะว่าหิวข้าวและไม่ได้กินข้าว.

    -----------------------------------------------------------------------------------------

    มนุษย์มีความสามารถในการแปลบทสนทนาแบบกำกวม โดยไม่พยายามที่จะกำจัดความกำกวมนั้น แต่เป็นการตั้งข้อสมมติและให้เหตุผลไปหลายๆทาง แตกกับคอมพิวเตอร์ที่ไม่สามารถประมวลผลกับความกำกวมได้ เพราะการทำงานต้องการคำสั่งที่ชัดเจนทุกๆคำสั่ง

    NLP ตอนนี้ทุกคนก็มุ่งไปที่การกำจัดความกำกวม แต่ผมมีความเชื่อที่ต่างออกไป

    ผมเชื่อว่าความกำกวมนั้นเป็นสิ่งที่จำเป็นเพื่อจะคงลักษณะความหมายแบบ dynamic ของภาษาไว้
    พูดง่ายๆก็คือ ภาษานั้น ถ้าหากเราพิจารณาประโยคหนึ่งๆ เมื่ออยู่ต่างบริบท(context) กันสามารถที่จะแปลความได้
    หลายความหมาย อันนี้นักภาษาศาสตร์ทุกคนตระหนักดี

    แต่สิ่งที่สำคัญกว่าคือภาษานั้นถึงแม้จะในบริบทเดียวกัน ก็สามารถถูกแปลความหมายได้มากกว่าหนึ่งทาง
    และความหมายเหล่านี้ จะต้องไม่ถูกกำจัดทิ้ง ผ่านการกำจัดความกำกวม!
    หากเรากำจัดมันทิ้ง
    ไม่มีอะไรสามารถรับประกันว่าสิ่งนั้นจะเป็นความหมายที่เราไม่ต้องการ ยกตัวอย่างเช่น

    บริบทของการท่องเที่ยว

    “ท้องทะเลไทยสวยงาม เหมาะเป็นแหล่งพักผ่อน”

    แปลความได้หลายอย่าง คือ
    หมายถึงใต้ท้องทะเล? –> ต้องดำน้ำไปดู –> พักผ่อนโดยการดำน้ำ?
    หรือหมายถึงทะเลร่วมถึงชายหาด? –> พักผ่อนแบบไหน?

    ยังมีประโยคอีกหลายแบบที่ได้ความหมายมากกว่าหนึ่งอย่างในบริบทเดียวกันเช่น

    “อยุธยาในตอนกลางคืนน่าท่องเที่ยวมาก โดยเฉพาะตามโบราณสถานที่มีประวัติยาวนาน”

    ความหมายที่ 1 : อยุธยาน่าท่องเที่ยวจริงๆในตอนกลางคืนเพราะจะสวยงาม
    ความหมายที่ 2 : อยุธยาน่าท่องเที่ยวในตอนกลางคืนเพราะจะได้เจอผี
    ความหมายที่ 3 : อยุธยาไม่น่าเที่ยวเลยโดยเฉพาะในเวลากลางคืนไม่เชื่อไปลองดูสิ

    จะสังเกตว่าแม้แต่ในบริบทเดียวกัน "ผลของการตีความไม่เพียงแต่ขึ้นอยู่กับบริบทเท่านั้น แต่ขึ้นกับประสบการณ์แวดล้อมที่ผู้รับสารได้ประสบมาอีกด้วย” และการตีความนี้สามารถเปลี่ยนแปลงได้หากได้รับข้อมูลใหม่ๆ เช่นคนที่ไม่เชื่อเรื่องผีที่ตีความเป็นความหมายที่ 2 กลับกลายเป็นตีความหมายเป็นประโยคที่ 3 เมื่อเจอผีดังนั้นจึงเป็นสิ่งจำเป็นมากที่จะต้องคงความกำกวมไว้เพื่อการตีความใหม่โดยการให้เหตุผลแบบลดทอนได้ (defeasible logic) ซึ่งเครื่องมือที่เหมาะสมในการให้เหตุผลในลักษณะนี้คือ abstract argument framework(Dung 1995).