搜索
查看 1019 回复 0

情感计算|人工智能如何识别你的喜怒哀乐?

[复制链接]

5025

主题

1128

回帖

1万

积分

管理员

积分
16818
发表于 2023-4-30 16:38:19|来自:北京 | 显示全部楼层 |阅读模式 IP:北京
情感计算|人工智能如何识别你的喜怒哀乐?

来源:科技世代千高原

作者:李政霖、李祈均


  机器透过生理识别数据进行训练后,得以进行情绪辨识,但在不同情境下就需考量更复杂的面向,这有赖于每一位使用者的主动回馈。
提要

1.微笑哭泣、音调高低、用字遣词都反映我们当下的情绪,这类生理反应经测量并计算后,可转化为情绪信息。

2.然而,这些情绪信息可能潜藏刻板印象与偏误,用于算法或在实际应用上便会引发不平等议题。

3.情感计算的数据来自于人们,因此用户、研发者与立法者三方的态度将会大幅影响这类科技的进展。


知名认知学者及计算机科学家明斯基(Marvin Minsky)曾说过:“问题不在于具有智能的机器能不能拥有任何情绪,而是机器具有智能之后怎麽可能没有情绪。” 情绪形塑个人生活,联系人际互动,影响群体氛围。科技发展至今,已体认到科技不够人性化就不受人们青睐,因此现今科技正在开拓一系列创新之路,要把情绪感知赋予科技,让科技更深入人心并走入生活,而情感计算(affective computing)就是其中之一。

情感计算的进展可回溯到1995年,美国麻省理工学院(MIT)媒体实验室的教授毕凯(Rosalind Picard)提出并开启了一项新兴跨领域研究。她除了以心理学理论为基础,也整合统计分析和人工智能(AI)技术,让电脑开始搜集相机、麦克风和生理穿戴式装置的信号,通过计算便能判读人们心理状态。

科学家发现,脸部表情的皱眉头或嘴角上扬都透露明显的情绪讯号,声音的抑扬顿挫和说话时的用字遣词,也是反映出情绪正负向和激动程度的要素,生理讯号则非常真实呈现感官受刺激后的情绪反应。这些信号经测量后,通过计算所取得的情绪信息,也回应了心理学深厚的理论知识。基于这些研究,不同领域的专家投入情感计算的技术开发,促进了这一跨领域学科形成。


辅助心理诊断

随着情感计算的技术持续开发,拓展出更多研究领域,例如在医疗健康上,情感计算可用于辅助诊断自闭症、思觉失调症和忧郁症等心理疾病。过去科学家透过观察个人行为表现并测量脑部活动,证实脑部的运作会部份反应在行为上,例如自闭症患者的脸部情绪可对应到脑电图(EEG),因此行为可做为临床衡量指标。

一般来说,心理相关疾病的诊断与治疗,需要仰赖有经验的精神科医师及临床心理师,以一对一面谈方式进行,并且往往需要患者或亲友主动寻求协助,较难于生活中实时判断并记录患者行为。而诊断及追踪的面谈过程有时会采用结构化或半结构化的量表做为衡量工具。如果有朝一日能运用情感计算技术来进行自动化评估,或许就能提升量表评估的效率,并辅助医师实时诊断患者,举例来说,透过眼动追踪、异样表情辨识及语音特征来计算或预测衡量指标,得以进一步了解自闭症严重程度。

类似技术也可运用于忧郁症的诊断及分类,无论是针对说话方式、头转动的角度或眼睛看的方向,都可能当做衡量指标,开发出相关技术加以评估。值得注意的是,一般人容易忽略的行为表现,透过情感计算的协助就可能发掘出隐含病征的细节。把原先耗时且涉及复杂人类行为的事务加以规模化(scaling),正是情感计算的潜在用途之一,例如从博客文章的内容来侦测作者的自杀倾向,或是从日益普及的穿戴式手环来观察使用者的压力和焦虑程度。情感计算有可能为我们增添新工具,来对付难缠的心理健康与压力问题。


此外,远距使用的优势也有机会拉近人与医疗资源的距离。2017年斯坦福大学团队推出并测试Woebot聊天机器人,这款应用采用认知行为治疗(CBT)的设计,请用户写下自己的想法,并在结构化的问答中,提供用户反思自身情绪并改变想法的机会。南加州大学团队则利用心理治疗系统Ellie,针对美国退伍军人的创伤后压力疾患(PTSD)来自动侦测微笑频率和持续时间,提供了追踪病程的线索。

过往实验也发现一种有趣现象,受试者在面对机器时反而比较愿意倾吐心声,正因为机器并不是真人,受试者得以抛开社交或身分顾虑,进而产生一种新的沟通途径。在新冠肺炎疫情期间,避免群聚造成人际疏离,可能添增大众的忧郁倾向,在医疗现场资源吃紧之下,远距科技辅助心理诊疗势必更受关注。

从上述研究,不禁令人思考人们与机器对话时会寻求哪方面的协助?Woebot创办人达西(Alison Darcy)也是心理学家,明确回应许多人的误解:“Woebot不是用于取代临床心理师!”相反地,情感计算研究拓展了心理辅导和咨商的新渠道,而且具有24小时不断线的优点,当人们怀有负面情绪时,或许能够弥补求助无门的空缺。

除了医疗方面的积极尝试,这些聊天机器人提供的陪伴和娱乐作用,或许有朝一日也能应用在大众的日常生活中。事实上,人们无时无刻都在“计算”自身情绪状态。上课时,学生会对不适合的教学步调或内容感到挫折,如果有对应的客观情绪反应指标,老师也许就能更适当调整。开车时,驾驶可能会打瞌睡,有了车用疲劳侦测装置的协助,就能降低车祸发生率。情感计算发展至今,正围绕着人类生活来尝试各种新的试验,也衍生出一些未来想象和应用场景。


数据本质是根本问题

情感计算研究的面向广泛,把研究结果融入日常生活,需要克服不少挑战,例如搜集的数据潜藏隐私问题、误用模型所造成的决策风险,以及预测偏误带来的潜在不平等议题。用于训练情感计算模型的数据库,通常强烈影响模型的预测结果,因此搜集并检查数据库内容的方法就变得相当重要。

过去研究人员测试Google提供的影像辨识服务时,发现机器较容易预测女性脸上有笑容。非情感计算的相关任务上也有类似情况,几家大公司提供的服务具有各种问题,例如对于预测黑人性别的较不准确,因而促成性别图谱(Gender Shade)项目,试图挖掘更深的偏误来源。偏误并不是这些大公司有意塑造,假如数据库中的女性大多面带微笑,自然软件很容易把女性和笑容直接链接成对应的特征,但这并非真正应该用于进行建模的特征。

这类以数据为基础的技术就像一面镜子,真实反映收录资料的内涵,当研究人员没有注意到数据库含有刻板印象和偏误时,无形中允许不平等存在于软件,只有刻意去观察才得以消除。

另外一类偏误来自于模型训练的过程,由于资料搜集相当困难,一项情绪辨识任务在测试初期通常高度简化,随着研究进展才逐步扩大应用情境。例如用于训练情绪辨识模型的音档,起初是由受试者朗读设计过的脚本来产生情绪,演变到搜集自然对话,甚至是电影及播客(podcast)等多媒体真实情境资料。即使模型在基本的脚本情境中得到高准确率,并不代表在其他生活化的情境中也能有同等表现,因此解读模型准确率不该只单看数字高低,需要更细致关注数据来源和应用情境。


上述对于情感计算模型的误解相当常见,提供技术的单位有责任揭露这些模型的限制和应用情境。在研发过程中,还需要注意另一种偏误来源,例如不考虑一句话的前后文,就要模型预测这句话所代表的情绪,或是不提供周围情境,就要模型判读一个脸部表情所代表的内在感受,在欠缺这些信息的情况下,很多时候连人类都没有把握能做出判断,又怎么能期待机器具有超乎人类的情感判断力呢?因此在训练情感计算模型时应该整合更多面向的数据,并采纳不同领域专家的意见。

情感同时牵涉身心层面,人们对情感的看法有一定程度的差异,任何专家都没有把握能全然掌握情感和行为的关系。事实上,这些议题长期存在,现今的科技应用都有类似问题,当情感计算用于判读人们内心感受,更需要有配套方法来处理相关伦理与隐私议题。关于伦理与法规的需求,学术圈已有众多学者参与讨论,在去年9月召开的情感计算与智能互动国际会议(ACII)正是以情感计算的伦理层面为主题,汇集技术社群,共同讨论如何为社会带来正面影响。


用户的积极反馈

从情感计算的技术和数据本质来看,就会发现这类研究融入生活并不简单。近年来我们团队针对不同情境,抽丝剥茧提出可能的技术突破点,例如让机器考量不同人在表达情绪时的表情、语音和用字的个人差异性,才进行情绪辨识 把分析讯号中情绪和人格特质的算法,设计成提供用户选择主要预测任务,并透过屏蔽技术去除用户不想揭露的信息。此外,发表在《IEEE信号处理杂志》针对情感计算技术进行归纳性的调查研究,从稳定性、一般化及使用性等三个面向剖析多年来进展。

除了学术研究不断强化技术面向上的不足,近年专家透过社群平台和媒体传递科普知识、汇整技术和产业发展趋势,都有助于社会对情感计算的理解。而情感计算发展的方向也有赖于每位用户的积极参与,多一些对情感计算的认识,才是推进此一技术的根基。用户需要理解情感计算目前可使用的情境,以及背后已经采用的技术,避免过度夸大情感计算的能力更是重要。

情感计算有了学术研究基础,也有应用于日常生活的可能性,下一步就需要聪明的用户正确使用情感计算服务。一个好的科技发展循环,是由用户、研发者和立法者共同串连。如果社会上多元的用户都能直接看见技术来源,也能直接传达对于技术发展的诉求,就决定了科技的下一步发展。

我们必须试着正确理解科技,注意误用情况,掌握自己的资料使用范围,扩大用户自主权。如果人类社会加入情感科技,将变得更有智慧,那不该是由科学家和工程师在实验室凭空想象出来,而是社会上每个人把需求回馈到科技进步的循环里,形塑有温度的科技。情感计算的下一步已经交到我们手上,主动参与,就能影响下个世代在情感、计算和生活上的模样。


(文献来源:《人工智慧情感怎運算?》,《科學人》雜誌(Scientific American 中文繁体版)2022年第240期2月號https://sa.ylib.com/MagArticle.aspx?id=5263&amputm_source=UDN)

采编:艾若

排版:莫一

审核:永方

美工/VI:小周

●“无内鬼,来点哲学memes”

●项飚:写作和发表成了异化程度最高的劳动方式

●一个民族的落后,首先是知识分子落后

●萨特:人为什么会有情欲?

●2022,你在哪里过年?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
淄博美食网免责声明
1.版权归淄博美食网或原作者所有;
2.转载或者引用本文内容请注明来源及原作者;
3.对于不遵守此声明或者其他违法使用本文内容者,我们依法保留追究权等。客服微信/QQ:502650550
回复

使用道具 举报

快速回帖

懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

联系客服 关注微信 下载APP 返回顶部 返回列表