向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
边疆考古重现古丝路上的交流传奇******
合浦望牛岭汉墓出土的部分珠饰 资料图片
近日,第四届中国边疆考古论坛在线上举行,考古学者围绕新疆、内蒙古、甘肃、西藏、四川,以及东北、华南地区的考古新发现作了四十多场精彩的报告。边疆地区因特殊的地理位置,与周边国家地区有着密切的互动,往往还是丝绸之路上的璀璨明珠,是西方文化传入中国的第一站。许多丝绸之路上东西方文化交流碰撞的故事,尘封千百年后,陆续在边疆考古中重见天日,过去的传奇得以揭开神秘面纱。
漂洋过海的玻璃珠
一颗颗色彩斑斓的珠子,可能只不过是墓主人生前手腕、颈间的点缀,而在考古学家眼中,它们并非只是精美的饰品,借助科技手段分析其成分、制作工艺、来源产地等,可以解读出复杂的贸易和技术传播故事。
位于广西合浦县城南部的望牛岭汉墓,就出土了总量超过4000件的各类珠饰品。它们由水晶、玛瑙、琥珀、玻璃材质制成,有的晶莹剔透如同露水一般纯净,也有的火红如珊瑚一般热烈,还有的是清爽的薄荷蓝色。以今日的审美看,它们也属实玲珑精致。中山大学社会学与人类学学院博士后张潇表示,这些珠子为典型的“舶来品”。望牛岭汉墓出土如此多的舶来珠饰,与其特殊的地理位置有关。合浦是两汉时合浦郡郡治所在,也是海上丝绸之路的始发港之一。《汉书·地理志》载,汉武帝时“有译长,属黄门,与应募者俱入海,市明珠、璧流璃、奇石异物,赍黄金杂缯而往”。汉代在宫廷官员的率领下,携带丝绸和黄金,从离南海最近的合浦等地乘船出发,前往南亚、东南亚各国进行贸易。有学者认为,“璧流璃”就是“琉璃”的别称,是古代对玻璃的称呼之一。这段史料说明,望牛岭汉墓出土的玻璃珠,可能正是如此漂洋过海“进口”来的。
合浦县附近的浦北县古时也属于合浦郡,县内的越州故城遗址出土了5000多颗玻璃珠。“经上海光机所检测,这些珠子是来源于南亚、东南亚地区的印度-太平洋贸易珠。”中山大学人类学与社会学学院副研究员韦伟燕介绍道。印度-太平洋贸易珠指采用拉制法制作的单彩玻璃珠,即把熔融的玻璃液用特别的工具拉成空心的细管,再将细管截成一粒粒小珠子,这类珠子广泛地生产和传播于印度洋和太平洋区域。越州故城遗址出土的大量玻璃珠进一步证明,在南朝时期,合浦仍是海上丝绸之路的重要节点之一。
透过一颗颗璀璨夺目的进口玻璃珠,我们仿佛可以窥见合浦“云帆高张,昼夜星驰”的繁荣景象,脑补出海上丝路始发港之一的千年传奇。
唐朝的基督教寺院
汉代张骞凿空西域后,沿着沟通中亚、西亚的陆地丝绸之路,随着大漠驼铃传入中国的,不仅仅是珠宝、玉石、香料等异域奇珍,还有包括景教在内的异域宗教文化。
唐朝时,景教(基督教聂斯托利派)沿着丝绸之路传入中国。盛唐对异域宗教采取海纳百川、兼容并包的态度,因此景教得以在都城长安等地传播。根据刻于唐德宗建中二年(公元781年)的《大秦景教流行中国碑》中记载,鼎盛时景教曾“法流十道,寺满百城”。
位于新疆维吾尔自治区昌吉州奇台县的唐朝墩古城遗址中,就揭露出一处始建于公元8世纪上半叶的唐代景教寺院遗址,可以作为这段历史的注释。寺院中出土了一件造型独特的釉陶器,表面是青蓝色的釉,上面还有蓝色的文字,“现在初步判断可能是叙利亚文,同时释读出‘我们’‘生命’‘神’等单词,它可能是当时进行某种特殊宗教活动所用的一种器具。”唐朝墩古城遗址考古发掘执行领队任冠介绍说。景教起源于今日叙利亚,因此使用叙利亚文,《大秦景教流行中国碑》也并存汉字与叙利亚文。
唐朝墩古城遗址位于天山东段博格达山与古尔班通古特沙漠之间东西交通要道上,也是丝绸之路一处咽喉重镇和交通枢纽。此次发掘的景教寺院遗址中有景教元素,也有汉文化元素,还有丝绸之路带来的多元文化因素。“寺院内出土了玛瑙、绿松石、玉石、琥珀等不同质地的珠饰,反映了丝绸之路上东西方不同文化的审美在景教寺院内的碰撞和交融。”任冠说。景教寺院遗址壁画中造型丰腴的带背光的圣像图,更是唐代人物形象丰腴的绘画风格与景教特色的结合。同时寺院中还出土了钧瓷的瓷片、绞胎瓷盘等。绞胎工艺是唐代陶瓷的新工艺。西方的珠饰、中原的瓷器同时出现在景教寺院中,也是东西方文化交融的印证。
口含金币的埋葬习俗
丝绸之路上,有一群高鼻深目,牵着骆驼贩运丝绸、珠宝、牲畜的人,他们就是以善于经商而著名的粟特人。粟特人的故乡在中亚两河流域,以撒马尔罕(在今乌兹别克斯坦境内)为中心。粟特人不仅是促进丝绸之路商贸往来的使者,而且是东西方文化交流的使者。能歌善舞的他们也促进了极具异域风情的粟特音乐和舞蹈东传,为中原艺术加入“胡风”元素。
在内蒙古呼和浩特沙梁子古城的殉马墓中,发现了一枚含在墓主人嘴右侧的金币。中山大学社会学与人类学学院副教授刘扬介绍金币的发掘过程说:“我们把(墓主人的)头抱起来的时候,掉下去了一小块泥,刚好露出了一点金光,当时还以为是墓主人的一个金牙,后来才发现是一个金币。”这枚金币图案为一面部清秀、无胡须的戴宝冠王者,只见他身穿铠甲,右手持枪从左肩斜出,左手则持盾挡于身侧。金币上有两个穿孔,说明金币应为墓主人生前的挂饰。金币为单面模压,极薄,应是东罗马帝国查士丁一世金币的仿制品。
刘扬介绍,这是中国发现的口含金币的第6个案例,之前还在新疆吐鲁番阿斯塔纳墓发现4例,在宁夏固原唐史道德墓发现1例,这5例均可能与粟特人有关,因此内蒙古呼和浩特发现的这一例也有可能是受到粟特人习俗的影响。呼和浩特位于古代草原丝绸之路上,因此很有可能有粟特人在此活动。北京大学考古文博学院教授齐东方认为,中国北部存在着一条从河西经包头、呼和浩特、大同、通过河北北部进入内蒙古赤峰,到达辽宁朝阳的东西交通路线,是历史上中国北部通往西方的国际线路。而北方草原丝绸之路的兴盛,自然会使善于经商的粟特人进入今辽宁、内蒙古一带。
不过目前考古学家依据葬式判断,沙梁子古城发现的殉马墓最有可能是唐代突厥墓葬。那么究竟这一墓葬是受到粟特人习俗影响的突厥墓,还是有可能成为国内首例发现的粟特人墓,尚有待进一步考证研究。
从南疆海上丝绸之路的始发港口,到西域陆地丝绸之路的景教寺院,再到塞北草原丝路上的殉马墓,均可见到东西方文化的交流碰撞。考古证实边疆地区自古以来就在“一带一路”发展进程中扮演着重要角色。千年来,大漠驼铃声声,海港云帆高张,繁荣畅达的丝路上,中外交流的传奇故事接连上演;如今,新时代“一带一路”上,更多文明互鉴、民心相通的故事也正在发生。
(本报记者 李韵 王笑妃)
(文图:赵筱尘 巫邓炎)