向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
早期中国文学中的极美与极丑******
作者:刘书刚(山东大学文学院副研究员)
美与丑是人们在日常生活、艺术品鉴中都广泛使用的一对概念。作为艺术形式之一种,文学自然是以美为尚的,俊美的人物,精美的器物,赏心悦目的风物景观,凡此种种历来是文学书写的重要对象。不过,触发审美愉悦的机制是复杂的,有时候,对一些丑陋怪奇的事物的精妙描写,同样也可让人在惊心骇目之后欢喜赞叹,审丑本身即是一种特殊的审美方式。在早期中国文学中,极美与极丑的书写即已大量存在,这类尝试既有助于拓展人们的想象力,也可促进表达技艺的提升,对于文学的演进有极大的推动作用。
一
古人很早就认识到美好之下往往暗藏凶险。《左传》记载了一个曲折离奇的桃色故事:夏姬是美色冠绝于世的一位奇女子,陈灵公及两位大臣孔宁、仪行父与之私通,身遭篡弑亡国之祸;楚庄王以平乱为由入陈,被掳回的夏姬又成为楚国君臣垂涎、争夺的对象。最终,申公巫臣运用智术,携夏姬奔往晋国,为此他放弃了自己在楚国的一切,也让宗族陷入灾难。夏姬的女儿同样是天生尤物,叔向想要聘娶,母亲劝阻他,指出“甚美必有甚恶”。“天钟美于是,将必以是大有败也。”(《左传·昭公二十八年》)夏姬母女那惊人的颜值,与一众相关男性的悲惨命运,无疑给当时人带来了巨大的震撼。将灾祸归结于女色,对夏姬等女性并不公允,只是,极美之物在散发出难以抵御的魅惑的同时,也让人心生恐惧,这颇合乎常情。
叔向母亲阐述的美恶相生,主要是从现实经验中总结出的祸福相倚之理,《老子》又将这些朴素的智慧,提炼为“天下皆知美之为美,斯恶已”(《老子》第二章)等警句。庄子则在极美、极丑两端同时发力书写,借以阐发自己的诸多思想,其另辟蹊径的思考,与别具风姿的文学风格正相适配,留下了许多脍炙人口的篇章。
极美、极丑的书写,都出现在庄子对得道之人,亦即所谓“神人”“至人”的描绘中。《逍遥游》篇中的神人是华美而曼妙的:“藐姑射之山,有神人居焉,肌肤若冰雪,绰约若处子。不食五谷,吸风饮露。乘云气,御飞龙,而游乎四海之外。”这纯粹而高洁的神人,居住在遥远的姑射之山,超脱于凡俗的人间,游走在广阔的空间里,怡然自得,自如无碍。特别值得注意的是,其他诸子所盛称的“圣人”,往往呈现为睿智深沉的中老年男性的样貌,唯独庄子笔下的神人,虽不能明确其性别,就其描述来看,无疑有着浓郁的女性色彩。这种设定究竟有何深意,是庄子留给后人的一个谜团,但寥寥数笔就勾勒出如此令人神往的形象,无疑显示了他非凡的语言天分。
饶有趣味的是,在庄子笔下,很多境界极高的人物又是身体畸形、残缺而丑陋的。《德充符》篇中集中描写了这类人物,他们寄托着庄子的人格理想,却有着奇怪的样貌。王骀为兀者,不知是因为先天的残疾,还是后天的处世不谨招致祸患而丧失一足,但其弟子徒属竟然跟孔子一样多,他的魅力究竟来自何处?更夸张的是哀骀它,他“以恶骇天下”,奇丑无比,“丈夫与之处者,思而不能去也。妇人见之,请于父母曰‘与为人妻宁为夫子妾’者,十数而未止也。”男子追随他不忍离去,女子甘愿为其做妾,这莫名其妙的吸引力,与其无与伦比的丑恶,形成强烈的反差。至于“闉跂支离无唇”“甕[~符号~]大瘿”等人,从名字就可看出形体的怪异,或身形卷曲没有嘴唇,或长有恶瘤大如甕[~符号~],但他们都让拥有权势的君主一见倾心。显然,庄子试图以此表明,外在的形貌无足轻重,这些怪人之所以有奇异的魅力,是因为他们内在完满充足的德行。
身体的畸形、残缺,有时来自造化那无可抗拒的伟力。庄子对于宇宙万物无休无止的运转有着深刻的认识,每一个个体,都裹挟在无穷无尽的变化中,都难免经历不知缘由、不可预测的变形记。他描写过一个叫子舆的人,因为一场大病,变得“曲偻发背,上有五管,颐隐于齐,肩高于顶,句赘指天,阴阳之气有沴”。由于佝偻到无以复加的程度,他的脸颊低垂到肚脐处,肩膀高于头顶,五脏六腑因此都在身体上端,体内的阴阳之气也紊乱无序。但他“心闲而无事,跰[~符号~]而鉴于井,曰:‘嗟乎!夫造物者又将以予为此拘拘也!’”(《庄子·大宗师》)他知道,这丑陋由造物赋予,与其不接受,甚至心生厌恶,何如以审美的心态,来观察造物那不可思议的创造力。庄子常以“观化”的态度来面对天地自然,变化本为世界之常态,降临在自己身上又何足为怪;而形体的转变越是丑陋,越是不忍直视,就越能凸显体道之人安时处顺的淡然。
庄子十分关注美、丑之间相反相成的关系,并质疑人们区分美丑的标准。何为美?何为丑?种种据以评断的原则,往往不过是个人的偏见。他用一个让人忍俊不禁的例子来说明这点:“猨猵狙以为雌,麋与鹿交,[~符号~]与鱼游。毛嫱丽姬,人之所美也;鱼见之深入,鸟见之高飞,麋鹿见之决骤。”(《庄子·齐物论》)猿猴与猵狙为匹偶,麋与鹿、[~符号~]与鱼相交,举世称艳的美女,在鸟兽眼中却是可怕的怪物,所谓的沉鱼落雁,实际上是避之唯恐不及。与此同理,每个人都有其喜好,有各自的审美标准,如果强迫别人与自己一致,或者自以为美,就会让人感到厌烦。“阳子之宋,宿于逆旅。逆旅人有妾二人,其一人美,其一人恶,恶者贵而美者贱。阳子问其故,逆旅小子对曰:‘其美者自美,吾不知其美也;其恶者自恶,吾不知其恶也。’”(《山木》)以美自居,甚至以此自傲,谁能跟这类人相处而不感到别扭、尴尬呢?庄子力证美、丑之别并无一定之规,是想提醒人们注意事物无比丰富的差异性,每一种存在物都有其天然的价值。
神人、至人等不妨美得惊人,也不妨丑得骇人,这本身就说明,美、丑之类的区别在庄子心中并不重要,它们不过是人们强加于事物的,何尝损益事物之本真。虽然无所偏颇,但整体而言,极美与极丑之间,庄子书写后者时花费了更多笔墨,因为这有助于他破除人们的常识与偏见。虽以丑陋为描绘对象,但他纵横肆意的想象力和恣纵鼓舞的行文,无疑制造了一道奇崛的文学景观,闻一多先生即盛赞庄子写丑,说他开出了中国文学中“以丑为美”的新境界。
二
庄子在文学上才华天纵,但书写极美、极丑的想法,未必是其一人独创,或许是受到了战国时代的娱乐文化和文学风气的影响。姑射之山上的神人为何富有女性色彩,缘由颇难确定,但在摹写极美的文学传统中,美女本就是一个最为重要的书写对象。这是自然而然的现象,女性是生活中最常见的美好,女色又是王侯贵族的一种重要消遣之物,呈现其姣好面容、要袅身姿和动人情态,自是文学的题中之义,对于一些偏于通俗、助人欢乐的文体而言更是如此。庄子之后不久,宋玉就以描摹美人绝色的赋作为自己赢得了声望,也为文学史增添了新的华彩。
《高唐赋》《神女赋》无疑是宋玉用力最深的赋作。两赋情节、文势相连一贯,实可视作上下二篇。《高唐赋》叙述楚王与宋玉游于云梦之台,观览变幻莫测的云气,宋玉称其为巫山神女所幻化,而神女又曾向楚之先王自荐枕席。以云气为神女化身,或是因为女子那难以捉摸,又缭绕缠绵的魅力,正与云气相类。不过,此赋的主体部分转向了对高唐自然景观的描写,在《神女赋》中,宋玉才纵笔描摹又在楚王梦中现身的神女。赋中,楚王先复述了梦中所见:“其始来也,耀乎若白日初出照屋梁;其少进也,皎若明月舒其光。须臾之间,美貌横生。晔兮如华,温乎如莹。五色并驰,不可殚形。详而视之,夺人目精。”神女之来,如日月一般让楚王的眼前充满光亮,细细查看,又是如花似玉、五色相宣,令人目不暇接,令人心驰神荡。
楚王又令宋玉以赋写形,试图保留这短暂的印象:“其状峨峨,何可极言。貌丰盈以庄姝兮,苞温润之玉颜。眸子炯其精朗兮,瞭多美而可观。眉联娟以蛾扬兮,朱唇的其若丹。素质干之醲实兮,志解泰而体闲。既姽婳于幽静兮,又婆娑乎人间。”通过对其身体各个部位的铺写,宋玉尽可能地展现神女形貌的每一个细节,这位翩然入梦的女性完美无瑕,几乎荟萃了时人对女性之美的所有想象。楚王、宋玉的先后描述,实际是将神女一人容貌做两番描写,更便于作者铺排笔阵、倾泻词源,宋玉也确实不遗余力地展现了自己巨大的词汇量和骋词造句的能力。这种无所不及、纤悉必具的写生留影,既是赋体的典型修辞特色,也能满足作者的炫才之心。此后,巫山云雨成为成语,不知承载着多少狎思和欲望。
早期赋作多与宫廷娱乐活动有关,赋之一体原本有俳谐轻俗的特质。虽然语涉狭邪,高唐、神女二赋的行文实际十分文雅,神女虽入楚王梦中,却能以礼自持,让楚王空留怅惘,可见宋玉已开始尝试提升赋体品格。相较而言,《登徒子好色赋》更能彰显极言美色的风气与当时游娱文化之间的关联,并且,极美之外,此篇也着笔于极丑一面,美、丑两面双峰并峙,相映成趣。
登徒子向楚王诋毁宋玉好色,这是一个充满谐趣的场景,宋玉则从容辩解。他说自己东家有女,“增之一分则太长,减之一分则太短;著粉则太白,施朱则太赤。眉如翠羽,肌如白雪;腰如束素,齿如含贝。嫣然一笑,惑阳城,迷下蔡。然此女登墙窥臣三年,至今未许也”。这位女子美得恰到好处,不假朱粉之修饰而天生丽质,但她越不可方物,就越能证明宋玉立身之谨严。至于登徒子,“其妻蓬头挛耳,齞唇历齿,旁行踽偻,又疥且痔。登徒子悦之,使有五子”。面对如斯丑妇尚不能克制欲望,究竟是谁好色,一目了然。宋玉夸张的自辩和夸诞的反击,无疑有让观者捧腹的效果。
书写极美是文学之当行本色,书写极丑则反映了追求谐谑的恶趣味。但这并非宋玉偶然涉笔,在当时的娱乐活动中,说丑与称美一样,可能都十分常见,为人喜爱。北京大学所藏西汉竹书中,有一篇名为《妄稽》的俗赋,可以证明极美、极丑的书写,在汉代仍然相当流行。
赋中,容貌德行俱佳的名族少年周春,在父母的安排下娶妄稽为妻,而妄稽的丑恶触目惊心,令人不敢直视:“妄稽为人,甚丑以恶。肿肵广肺,垂颡折额。臂夭八寸,指长二尺。股不盈骈,胫大五握。蔑畛领腋,食既相泽。勺乳绳萦,坐肄于席。尻若冣笱,膞膌格格。目若别杏,蓬髪颇白。年始十五,面尽魿腊。足若悬姜,胫若棪株。身若猬棘,必好抱躯。口臭腐鼠,必欲钳须。”即使想象力再充沛,恐怕也无法通过这大段的排比文字,在脑海中复原出妄稽的面貌,她几乎是一个全无人形的怪物。周春无法忍受与其一起生活,又纳虞士为妾,而虞士则是一位秀出人伦的美女:“色若春荣,身类[~符号~]素。赤唇白齿,长颈宜顾。□泽比丽,甚善行步。□□□……出辞和暇。手若阴蓬,足若踹卵。丰肉小骨,微细比转。眺目钩折,蚁犂睫管。”她让周春一见钟情,也得到万千宠爱。
妄稽不仅容貌丑陋,还既妒且悍。尽管虞士一再示好示弱,她还是不能接受妻妾共处的生活,对虞士大加迫害,此赋的情节也因此越来越离奇。为了使虞士免于灾难,周春甚至为其建造了一个坚固的堡垒,然而,在他外出之际,墉墙之坚,重门之深,还是阻挡不了妄稽的入侵。她劫走虞士,大加捶笞,虞士命悬一线,幸而周春及时赶回,方才逃得性命。值得注意的是,妄稽之丑与虞士之美,赋中都一写再写,极力铺衍。美、丑甚至有了相互催发的效果:妄稽越是丑拙暴虐,虞士就越发楚楚可怜。
这个看起来无法收场的故事,以妄稽病死终结,临终之际,她因为自己的残暴而露出悔意。周春为何会娶妄稽?此赋的一些情节事理上难以索解。不过,“妄稽”即无稽之意,表明此赋纯属虚构,并无意于讲述一个合情合理的故事。对于当时的读者或观众而言,从极美、极丑的反差中,从丑妇作怪的戏剧性情节里获得愉悦,才是赋作最主要的功能,此篇因此具有极其强烈的戏谑、调笑色彩。《妄稽》篇已有残缺,据整理者推算,原文当有三千余字,篇幅不可谓短,堪称早期文学中极美、极丑书写的集成之作。
在赋体文学中,摹写美人是一个经典题材,宋玉之后,曹植《洛神赋》最为知名。同样值得注意的是,丑妇书写在赋体中也代有所作,甚至不乏佳构。相传潘越即有《丑妇赋》,可惜已经亡佚,敦煌文献中则保存了赵洽《丑妇赋》与《丑女缘起》等篇,明清之时,仍有人以此为题进行创作。必须承认,无论是书写美人还是丑妇,都有物化女性的嫌疑,但作为一个源远流长的文学传统,这些书写既为文人提供了炫耀才华的契机,也给读者带来开怀一笑的愉悦。
极美、极丑的书写,庄子借之阐发哲思,破解人们的执念和偏见,《妄稽》作为一篇故事赋,主要功能在于取悦观众、佐人清欢,至于宋玉,他的赋作有偏向于俗的一面,也有化俗为雅的努力。总之,这组题材出入雅俗之间,有着丰富的面向和多样的精彩。进一步说,极美、极丑的意象在早期中国文学中实际有广泛的存在。《诗经》中有“巧笑倩兮,美目盼兮”的硕人,也有肮脏的籧篨、戚施;屈原作品中大量存在的香草美人与粪壤萧艾,也是用美、丑的对比,来形容诗人与污浊尘世的格格不入。推想事物的极端状态并极力描写,是思维与语言的双重实验,会迫使学人才士们神思飞扬,也要求撰文者提升表达技艺和修辞功力,这无疑有助于拓展文学的疆域,推动文学史的前进和发展。
《光明日报》( 2023年01月09日 13版)
(文图:赵筱尘 巫邓炎)