Bước tới nội dung

Thành viên:NGUYENTHANH.ASIA/Test/1

Bách khoa toàn thư mở Wikipedia
Tập tin:Sally-Anne test.jpg
Bộ phim hoạt hình Sally–Anne gốc được sử dụng trong bài kiểm tra của Baron-Cohen, Leslie và Frith (1985)

Bài kiểm tra Sally–Anne là một bài kiểm tra tâm lý học, được sử dụng trong tâm lý học phát triển để đo lường khả năng nhận thức xã hội của một người trong việc quy cho người khác các niềm tin sai.[1] Dựa trên nghiên cứu đột phá trước đó của Wimmer và Perner (1983),[2] bài kiểm tra Sally–Anne được đặt tên bởi Simon Baron-Cohen, Alan M. Leslie, và Uta Frith (1985) khi họ phát triển thêm bài kiểm tra này;[3] năm 1988, Leslie và Frith lặp lại thí nghiệm với diễn viên thực (thay vì búp bê) và thu được kết quả tương tự.[4]

Mô tả bài kiểm tra

[sửa | sửa mã nguồn]

Để phát triển một bài kiểm tra hữu hiệu, Baron-Cohen et al. đã sửa đổi mô hình chơi rối của Wimmer và Perner (1983), trong đó các con rối đại diện cho các nhân vật cụ thể trong một câu chuyện, thay vì các nhân vật giả định của câu chuyện thuần túy.

Trong quá trình thử nghiệm, sau khi giới thiệu các con búp bê, đứa trẻ được hỏi câu hỏi kiểm soát để gọi tên chúng (Câu hỏi gọi tên). Một vở kịch ngắn được thực hiện; Sally lấy một viên bi và giấu nó trong rổ của mình. Sau đó, cô ta "rời" phòng và đi dạo. Trong khi cô ta đi, Anne lấy viên bi ra khỏi rổ của Sally và đặt nó vào hộp của cô ta. Sau đó, Sally được đưa trở lại và đứa trẻ được hỏi câu hỏi chính, Câu hỏi về niềm tin: "Sally sẽ tìm viên bi của mình ở đâu?"[3]

Trong nghiên cứu của Baron-Cohen, Leslie và Frith về Lý thuyết tâm trí trong chứng tự kỷ, 61 trẻ em—20 trong số đó được chẩn đoán mắc chứng tự kỷ theo tiêu chí đã được thiết lập, 14 trẻ mắc hội chứng Down và 27 trẻ được xác định là không mắc bệnh lâm sàng—đã được thử nghiệm với "Sally" và "Anne".[3]

Kết quả

[sửa | sửa mã nguồn]

Để một người tham gia đạt điểm trong bài kiểm tra này, họ phải trả lời Câu hỏi về niềm tin một cách chính xác bằng cách chỉ ra rằng Sally tin rằng viên bi của mình vẫn ở trong rổ của cô ta. Câu trả lời này phải phù hợp với quan điểm của Sally, nhưng không phải với quan điểm của người tham gia. Nếu người tham gia không thể thay đổi quan điểm, họ sẽ chỉ ra rằng Sally có lý do để tin, như người tham gia, rằng viên bi đã được di chuyển. Vượt qua bài kiểm tra được coi là sự thể hiện của một người tham gia hiểu rằng Sally có những niềm tin riêng không tương ứng với thực tế; đây là yêu cầu cốt lõi của Lý thuyết tâm trí.[5]

Trong nghiên cứu của Baron-Cohen et al. (1985), 23 trong số 27 trẻ không mắc bệnh lâm sàng (85%) và 12 trong số 14 trẻ mắc hội chứng Down (86%) đã trả lời chính xác Câu hỏi về niềm tin. Tuy nhiên, chỉ có bốn trong số 20 trẻ mắc chứng tự kỷ (20%) trả lời đúng. Nhìn chung, trẻ em dưới bốn tuổi, cùng với hầu hết trẻ mắc chứng tự kỷ (ở độ tuổi lớn hơn), đã trả lời Câu hỏi về niềm tin với "hộp của Anne", dường như không nhận ra rằng Sally không biết viên bi đã được di chuyển.[3]

Chỉ trích

[sửa | sửa mã nguồn]

Trong khi dữ liệu của Baron-Cohen và cộng sự được cho là chỉ ra sự thiếu hụt của lý thuyết tâm trí ở trẻ tự kỷ, có những yếu tố khác có thể ảnh hưởng đến chúng. Ví dụ, những người mắc chứng tự kỷ có thể vượt qua nhiệm vụ nhớ lại đơn giản hơn về nhận thức, nhưng các vấn đề về ngôn ngữ ở cả trẻ tự kỷ và nhóm đối chứng khiếm thính thường gây nhầm lẫn kết quả.[6]

Ruffman, Garnham và Rideout (2001) đã tiếp tục điều tra mối liên hệ giữa bài kiểm tra Sally–Anne và tự kỷ dưới góc độ ánh mắt như một chức năng giao tiếp xã hội. Họ thêm vào một vị trí thứ ba có thể cho viên bi: túi của người điều tra. Khi trẻ tự kỷ và trẻ có khuyết tật học tập vừa phải được thử nghiệm ở định dạng này, họ nhận thấy cả hai nhóm đều trả lời câu hỏi về niềm tin một cách đồng đều; tuy nhiên, các trẻ có khuyết tật học tập vừa phải đáng tin cậy nhìn vào vị trí chính xác của viên bi, trong khi trẻ tự kỷ thì không, ngay cả khi trẻ tự kỷ trả lời câu hỏi đúng.[7] Những kết quả này có thể là biểu hiện của các thiếu hụt xã hội liên quan đến chứng tự kỷ.

Tager-Flusberg (2007) tuyên bố rằng bất chấp các phát hiện thực nghiệm với bài kiểm tra Sally–Anne, có sự không chắc chắn ngày càng tăng giữa các nhà khoa học về tầm quan trọng của giả thuyết lý thuyết tâm trí về chứng tự kỷ. Trong tất cả các nghiên cứu đã được thực hiện, một số trẻ tự kỷ vượt qua các nhiệm vụ niềm tin sai như Sally–Anne.[8]

Ở các loài người khác

[sửa | sửa mã nguồn]

Dò tìm ánh mắt của loài tinh tinh, bonobo và đười ươi cho thấy cả ba loài đều dự đoán được niềm tin sai của một đối tượng trong bộ đồ King Kong và vượt qua bài kiểm tra Sally–Anne.[9][10]

Trí tuệ nhân tạo

[sửa | sửa mã nguồn]

Các nhà nghiên cứu trí tuệ nhân tạokhoa học nhận thức tính toán từ lâu đã cố gắng mô phỏng khả năng của con người trong việc suy luận về các niềm tin (sai) của người khác trong các nhiệm vụ như bài kiểm tra Sally-Anne. Nhiều phương pháp đã được áp dụng để tái tạo khả năng này trong máy tính, bao gồm các phương pháp mạng nơ-ron,[11] nhận diện kế hoạch nhận thức,[12] và lý thuyết tâm trí Bayes.[13] Các phương pháp này thường mô hình hóa các tác nhân như lựa chọn hành động theo lí trí dựa trên niềm tin và mong muốn của họ, điều này có thể được sử dụng để dự đoán hành động trong tương lai của họ (như trong bài kiểm tra Sally-Anne), hoặc để suy luận niềm tin và mong muốn hiện tại của họ. Trong các thiết lập hạn chế, các mô hình này có thể tái tạo biểu hiện giống như con người trên các nhiệm vụ tương tự bài kiểm tra Sally-Anne, với điều kiện các nhiệm vụ này được biểu diễn ở dạng có thể đọc được bằng máy.

Ngày 22 tháng 3 năm 2023, một nhóm nghiên cứu từ Microsoft đã phát hành một bài báo cho thấy hệ thống AI dựa trên LLM GPT-4 có thể vượt qua một phiên bản của bài kiểm tra Sally–Anne, mà các tác giả nói rằng "gợi ý rằng GPT-4 có một mức độ lý thuyết tâm trí rất cao."[14] Tuy nhiên, tính tổng quát của phát hiện này đã bị tranh cãi bởi một số bài báo khác, cho thấy rằng khả năng suy luận về niềm tin của các tác nhân khác của GPT-4 vẫn còn hạn chế (59% độ chính xác trên Bộ đánh giá ToMi),[15] và không chắc chắn với những thay đổi "gây rối" đối với bài kiểm tra Sally-Anne mà con người có thể linh hoạt xử lý.[16][17] Trong khi một số tác giả lập luận rằng hiệu suất của GPT-4 trên các nhiệm vụ giống như Sally-Anne có thể được tăng lên 100% thông qua các chiến lược gợi ý cải tiến,[18] phương pháp này dường như chỉ cải thiện độ chính xác lên 73% trên tập hợp dữ liệu ToMi lớn hơn.[16] Trong công việc liên quan, các nhà nghiên cứu đã phát hiện rằng các LLM không thể hiện các trực giác giống như con người về các mục tiêu mà các tác nhân khác vươn tới,[19] và rằng chúng không tin cậy để sản sinh ra những suy luận phân biệt về các mục tiêu của các tác nhân khác từ các hành động quan sát.[20] Mức độ mà các LLM như GPT-4 có thể thực hiện suy luận xã hội do đó vẫn là một lĩnh vực nghiên cứu đang hoạt động.

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ Wimmer, Heinz; Perner, Josef (tháng 1 năm 1983). “Beliefs about beliefs: Representation and constraining function of wrong beliefs in young children's understanding of deception”. Cognition. 13 (1): 103–128. doi:10.1016/0010-0277(83)90004-5. PMID 6681741. S2CID 17014009.
  2. ^ Wimmer & Perner (1983). “Beliefs about beliefs: Representation and constraining function of wrong beliefs in young children's understanding of deception. Cognition, 13, 103-128”.
  3. ^ a b c d Baron-Cohen, Simon; Leslie, Alan M.; Frith, Uta (tháng 10 năm 1985). “Does the autistic child have a "theory of mind"?”. Cognition. 21 (1): 37–46. doi:10.1016/0010-0277(85)90022-8. PMID 2934210. S2CID 14955234. Pdf.
  4. ^ Leslie, Alan M.; Frith, Uta (tháng 11 năm 1988). “Autistic children's understanding of seeing, knowing and believing”. British Journal of Developmental Psychology. 6 (4): 315–324. doi:10.1111/j.2044-835X.1988.tb01104.x.
  5. ^ Premack, David; Woodruff, Guy (tháng 12 năm 1978). “Does the chimpanzee have a theory of mind?”. Behavioral and Brain Sciences. 1 (4): 515–526. doi:10.1017/S0140525X00076512.
  6. ^ “Autism and Theory of Mind: A Theory in Transition”. www.jeramyt.org. Truy cập ngày 9 tháng 10 năm 2016.
  7. ^ Ruffman, Ted; Garnham, Wendy; Rideout, Paul (tháng 11 năm 2001). “Social understanding in autism: eye gaze as a measure of core insights”. Journal of Child Psychology and Psychiatry. 42 (8): 1083–1094. doi:10.1111/1469-7610.00807. PMID 11806690.
  8. ^ Tager-Flusberg, Helen (tháng 12 năm 2007). “Evaluating the theory-of-mind hypothesis of autism”. Current Directions in Psychological Science. 16 (6): 311–315. doi:10.1111/j.1467-8721.2007.00527.x. S2CID 16474678.
  9. ^ Krupenye, Christopher; Kano, Fumihiro; Hirata, Satoshi; Call, Josep; Tomasello, Michael (7 tháng 10 năm 2016). “Great apes anticipate that other individuals will act according to false beliefs”. Science (bằng tiếng Anh). 354 (6308): 110–114. Bibcode:2016Sci...354..110K. doi:10.1126/science.aaf8110. hdl:10161/13632. ISSN 0036-8075. PMID 27846501.
  10. ^ Devlin, Hannah (6 tháng 10 năm 2016). “Apes can guess what others are thinking - just like humans, study finds”. The Guardian (bằng tiếng Anh). ISSN 0261-3077. Truy cập ngày 9 tháng 10 năm 2016. Chú thích có tham số trống không rõ: |1= (trợ giúp)
  11. ^ Rabinowitz, Neil; Perbet, Frank; Song, Francis; Zhang, Chiyuan; Eslami, S. M. Ali; Botvinick, Matthew (3 tháng 7 năm 2018). “Machine Theory of Mind”. Proceedings of the 35th International Conference on Machine Learning (bằng tiếng Anh). PMLR: 4218–4227.
  12. ^ Shvo, Maayan; Klassen, Toryn Q.; Sohrabi, Shirin; McIlraith, Sheila A. (13 tháng 5 năm 2020). “Epistemic Plan Recognition”. Proceedings of the 19th International Conference on Autonomous Agents and MultiAgent Systems. AAMAS '20. Richland, SC: International Foundation for Autonomous Agents and Multiagent Systems: 1251–1259. ISBN 978-1-4503-7518-4.
  13. ^ Baker, Chris L.; Jara-Ettinger, Julian; Saxe, Rebecca; Tenenbaum, Joshua B. (13 tháng 3 năm 2017). “Rational quantitative attribution of beliefs, desires and percepts in human mentalizing”. Nature Human Behaviour (bằng tiếng Anh). 1 (4): 1–10. doi:10.1038/s41562-017-0064. ISSN 2397-3374. S2CID 3338320.
  14. ^ Bubeck, Sébastien; Chandrasekaran, Varun; Eldan, Ronen; Gehrke, Johannes; Horvitz, Eric; Kamar, Ece; Lee, Peter; Lee, Yin Tat; Li, Yuanzhi (2023). "Sparks of Artificial General Intelligence: Early experiments with GPT-4". arΧiv:2303.12712v5 [cs.CL]. 
  15. ^ Sap, Maarten; LeBras, Ronan; Fried, Daniel; Choi, Yejin (2022). "Neural Theory-of-Mind? On the Limits of Social Intelligence in Large LMs". arΧiv:2210.13312 [cs.CL]. 
  16. ^ a b Shapira, Natalie; Levy, Mosh; Alavi, Seyed Hossein; Zhou, Xuhui; Choi, Yejin; Goldberg, Yoav; Sap, Maarten; Shwartz, Vered (2023). "Clever Hans or Neural Theory of Mind? Stress Testing Social Reasoning in Large Language Models". arΧiv:2305.14763 [cs.CL]. 
  17. ^ Ullman, Tomer (2023). "Large Language Models Fail on Trivial Alterations to Theory-of-Mind Tasks". arΧiv:2302.08399 [cs.AI]. 
  18. ^ Moghaddam, Shima Rahimi; Honey, Christopher J. (2023). "Boosting Theory-of-Mind Performance in Large Language Models via Prompting". arΧiv:2304.11490 [cs.AI]. 
  19. ^ Ruis, Laura; Findeis, Arduin; Bradley, Herbie; Rahmani, Hossein A.; Choe, Kyoung Whan; Grefenstette, Edward; Rocktäschel, Tim (29 tháng 6 năm 2023). “Do LLMs selectively encode the goal of an agent's reach?” (bằng tiếng Anh). Chú thích journal cần |journal= (trợ giúp)
  20. ^ Ying, Lance; Collins, Katherine M.; Wei, Megan; Zhang, Cedegao E.; Zhi-Xuan, Tan; Weller, Adrian; Tenenbaum, Joshua B.; Wong, Lionel (2023). "The Neuro-Symbolic Inverse Planning Engine (NIPE): Modeling Probabilistic Social Inferences from Linguistic Inputs". arΧiv:2306.14325 [cs.AI].