Tech

“GPT Chat” ล้มเหลวในการวินิจฉัยทางการแพทย์ อย่าใช้มัน

“GPT Chat” ล้มเหลวในการวินิจฉัยทางการแพทย์  อย่าใช้มัน
Written by Sitedeets

ทีมวิจัยที่นำโดยนักวิทยาศาสตร์จากมหาวิทยาลัยการแพทย์และทันตกรรมแห่งโตเกียวสามารถแสดงให้เห็นว่าการวินิจฉัยทางการแพทย์ ChatGBT สำหรับกลุ่มโรคกระดูกไม่สามารถพึ่งพาได้ในทางใดทางหนึ่ง ซึ่งดึงดูดความสนใจไปยังปัญหาสำคัญที่เกี่ยวข้องกับการแพร่กระจายของการวินิจฉัย ตัวเอง.

จากการศึกษาครั้งใหม่ซึ่งทีมนี้ตีพิมพ์ในวารสาร Medical Internet Research นักวิจัยได้ประเมินความแม่นยำของการตอบสนองของหุ่นยนต์ “GPT Chat” ต่ออาการของโรคกระดูกที่พบบ่อย 5 โรค เช่น: โรค carpal tunnel, myelopathy ปากมดลูก และโรคกระดูกพรุนสะโพก

การวินิจฉัย ChatGPT มีความแม่นยำ 100% สำหรับโรค carpal tunnel (Anatolia Agency)

สามารถใช้ในการวินิจฉัยทางการแพทย์ได้หรือไม่?

ตลอดระยะเวลาการทดลองห้าวัน นักวิจัยในการศึกษาใหม่แต่ละคนได้นำเสนอคำถามเดียวกันในการแชท GBT โดยให้อาการ และถามแชทบอทเกี่ยวกับโรคนี้

การศึกษาระบุว่าการวินิจฉัย “GPT Chat” มีความแม่นยำ 100% สำหรับโรค carpal tunnel แต่ความแม่นยำลดลงเหลือเพียง 4% สำหรับ myelopathy ปากมดลูก และที่แย่กว่านั้นคือคำตอบของ “หุ่นยนต์” ในแต่ละคนแตกต่างกันเกี่ยวกับ โรคร้ายนั้นเอง สิ่งเหล่านี้มักจะไม่สอดคล้องกันซึ่งเป็นข้อผิดพลาดในความถูกต้องของวิธีการวินิจฉัย

นักวิจัยยังพบว่าแม้ว่าเกือบ 80% ของคำตอบของเขาจะแนะนำคำแนะนำทางการแพทย์ แต่มีเพียง 12.8% ของคำตอบเท่านั้นที่มีคำแนะนำที่ชัดเจนในภาษาโดยตรง

ตามคำแถลงที่เผยแพร่โดยมหาวิทยาลัยการแพทย์และทันตกรรมแห่งโตเกียว สิ่งสำคัญคือเครื่องมือวินิจฉัยจะต้องมีภาษาที่ชัดเจน เพื่อเตือนผู้ป่วยให้ขอความเห็นจากผู้เชี่ยวชาญทางการแพทย์เพื่อยืนยันโรค

อนาคตของการแพทย์

ตามบทความวิจัยที่ตีพิมพ์ในวารสาร Nature Medicine เมื่อเดือนกันยายนปีที่แล้ว แพทย์และนักวิจัยต่างเห็นพ้องกันว่าการอนุญาตให้แชทบอทโดยทั่วไปโต้ตอบกับผู้ป่วยนั้นถือเป็นการกระทำที่ประมาท และควรพิจารณาอย่างรอบรู้

อังการา, ตุรกี - 05 กันยายน: ในภาพนี้ โลโก้ ChatGPT กำลังแสดงบนหน้าจอโทรศัพท์มือถือที่หน้าจอคอมพิวเตอร์ที่แสดงแท็บเล็ตสำหรับรับประทานยา ในเมืองอังการา เมืองเตอร์กิเย เมื่อวันที่ 5 กันยายน 2023 (ภาพโดย Harun Ozalp/Anadolu เอเจนซี่ผ่าน Getty Images)
ขณะนี้บางบริษัทกำลังพยายามออกแบบ “หุ่นยนต์” สนทนาที่เป็นมากกว่าการวินิจฉัยไปจนถึงการรักษา (Anatolia Agency)

ตามรายงานนี้ คนทำงานในอุตสาหกรรมเทคโนโลยีก็มีความกังวลเช่นเดียวกัน เมื่อเดือนมีนาคมที่ผ่านมา ผู้นำในอุตสาหกรรมเทคโนโลยีมากกว่า 1,000 รายได้ออกจดหมายเปิดผนึกเรียกร้องให้ยุติการพัฒนาปัญญาประดิษฐ์ชั่วคราว ซึ่งส่วนหนึ่งเกี่ยวข้องกับความเสี่ยงเหล่านี้

แต่ผู้เชี่ยวชาญในสาขาเหล่านี้ไม่ได้บอกว่าแชทบอทจะไม่มีประสิทธิภาพอย่างถาวร แต่พวกเขาต้องการการพัฒนาและการทดสอบทางการแพทย์จำนวนมาก ซึ่งผลลัพธ์จะถูกตีพิมพ์ในวารสารที่ผ่านการตรวจสอบโดยผู้ทรงคุณวุฒิ เพื่อยืนยันความเหมาะสมสำหรับการวินิจฉัยทางการแพทย์

นอกจากนี้ บางบริษัทกำลังพยายามออกแบบแชทบอทที่เป็นมากกว่าการวินิจฉัยไปจนถึงการรักษา โดยเฉพาะอย่างยิ่งในด้านจิตบำบัดที่ไม่ใช่เภสัชวิทยา ซึ่งแชทบอทสามารถช่วยเหลือผู้ป่วยด้วยคำแนะนำในการรักษา แต่ถึงแม้ในกรณีนั้น การดูแลทางการแพทย์ยังคงเป็นสิ่งจำเป็น

ที่กล่าวมาทั้งหมดมาในบริบทที่สำคัญ กล่าวคือ มีการค้นหาบน Google ถึง 3 แสนล้านครั้งต่อปีในหัวข้อทางการแพทย์ และผู้คนมักจะได้รับข้อมูลทางการแพทย์และวินิจฉัยตนเองจากเครื่องมือค้นหา ซึ่งจริงๆ แล้วทำให้เกิดปัญหาใหญ่และทำให้แชทบอทเป็น พลังอันทรงพลัง แนวทางใหม่ในการแพทย์

GPT Chat คืออะไร

Chat GBT เป็นโมเดลภาษาขนาดใหญ่ที่สามารถเข้าใจและสร้างภาษาเพื่อวัตถุประสงค์ทั่วไป และได้รับความสามารถเหล่านี้จากการใช้ข้อมูลจำนวนมหาศาลในการเรียนรู้ในลักษณะเดียวกับที่มนุษย์เรียนรู้ภาษา แต่มีข้อได้เปรียบที่สำคัญต่อมนุษย์ จนถึงตอนนี้

“GPT Chat” เปิดตัวในเดือนพฤศจิกายน 2022 ในฐานะ “บอท” แชทที่สร้างขึ้นจากโมเดลภาษาขนาดใหญ่ตระกูล “GPT-3” ของบริษัทอเมริกัน OpenAI และได้รับความสนใจอย่างมากอย่างรวดเร็วสำหรับการตอบสนองโดยละเอียดในความรู้หลายด้าน .

About the author

Sitedeets

Leave a Comment

Best Automated Bot Traffic