向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
高质量发展取得的成就与经验******
作者:蒋永穆(四川大学经济学院教授)
党的二十大报告强调:“高质量发展是全面建设社会主义现代化国家的首要任务。”坚定不移推动高质量发展、走高质量发展的路子,既是新时代取得伟大变革的重要经验,也是未来一个时期更好推动经济社会发展的必然选择。
非凡十年,我们党团结带领人民,采取一系列战略性举措,推进一系列变革性实践,实现一系列突破性进展,取得一系列标志性成果,推动我国迈上全面建设社会主义现代化国家新征程。在这一非凡历程中,尤为重要的一条就是明确“我国经济已由高速增长阶段转向高质量发展阶段”,强调“高质量发展不只是一个经济要求,而是对经济社会发展方方面面的总要求;不是只对经济发达地区的要求,而是所有地区发展都必须贯彻的要求;不是一时一事的要求,而是必须长期坚持的要求”。梳理总结新时代十年我国推动高质量发展取得的成就与经验,是全面建设社会主义现代化国家的内在要求。
推动高质量发展取得非凡成就
十年来,我们党提出并贯彻新发展理念,着力推进高质量发展,推动构建新发展格局,取得了一系列伟大成就。
经济实力实现历史性跃升。党的十八大以来,国内生产总值从54万亿元增长到114万亿元,经济总量占世界经济的比重达18.5%,提高7.2个百分点,稳居世界第二位。2013年至2021年,我国对世界经济增长的平均贡献率达到38.6%,超过G7国家贡献率的总和,是推动世界经济增长的第一动力。即便面对全球经济发展不稳定不确定因素持续增多的复杂形势,我国经济韧性强、潜力大、活力足,长期向好的基本面没有变,也不会改变。
进入创新型国家行列。我国科技创新事业坚持面向世界科技前沿、面向经济主战场、面向国家重大需求、面向人民生命健康,加快实现高水平科技自立自强。全社会研发经费支出从1万亿元增加到2.8万亿元,居世界第二位,研发人员总量居世界首位;基础研究和原始创新不断加强,一些关键核心技术实现突破,战略性新兴产业发展壮大。随着科技创新实力提升,我国深度参与国际前沿创新,为解决各类全球性问题作出了重要贡献。
城乡区域发展的协调性增强。我国制定一系列具有全局性意义的区域重大战略,推进以人为核心的新型城镇化,坚持城乡融合发展,城乡一体化发展水平持续提升,区域协调发展格局进一步优化。经过多年发展,我国城镇化率达到64.7%。农村居民收入水平不断提升,城乡居民人均可支配收入差距由2.88∶1降至2.5∶1。
生态环境保护发生历史性、转折性、全局性变化。我们坚持绿水青山就是金山银山的理念,坚持山水林田湖草沙一体化保护和系统治理,全方位、全地域、全过程加强生态环境保护,加快发展方式绿色转型。经过努力,单位国内生产总值二氧化碳排放量累计下降约34%,风电、光伏发电等绿色电力的装机容量居世界第一,建成了世界最大的清洁发电体系,空气质量和地表水水质持续提升,绿色成为经济社会发展的鲜明底色。
形成更大范围、更宽领域、更深层次对外开放格局。我们实行更加积极主动的开放战略,着力构建面向全球的高标准自由贸易区网络,我国已成为140多个国家和地区的主要贸易伙伴。同时,加快推进自由贸易试验区、海南自由贸易港建设,共建“一带一路”成为深受欢迎的国际公共产品和国际合作平台。
人民生活全方位改善。我们坚持维护人民根本利益、增进民生福祉,在幼有所育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶上持续用力。历史性地解决了绝对贫困问题,近1亿农村贫困人口实现脱贫,建成世界上规模最大的教育体系、社会保障体系、医疗卫生体系,人民群众获得感、幸福感、安全感更加充实、更有保障、更可持续,共同富裕取得新成效。
在发展实践中形成的重要经验
我们党团结带领人民着力推进高质量发展,在取得非凡成就的同时,也积累了重要经验。
第一,坚持和加强党的全面领导。中国特色社会主义最本质的特征是中国共产党领导,中国特色社会主义制度的最大优势是中国共产党领导,中国共产党是最高政治领导力量。新时代十年的实践成就充分证明,推进高质量发展必须坚持党的领导,发挥党总揽全局、协调各方的领导核心作用,切实把党领导各项工作的制度优势转化为治理效能。只要我们坚持党的全面领导不动摇,坚决维护党的核心和党中央权威,把党的领导落实到党和国家事业各领域各方面各环节,就能确保我国社会主义现代化建设正确方向,牢牢把握发展的主动权,将高质量发展向前推进。
第二,坚持以人民为中心的发展思想。人民群众是历史的创造者,是党执政兴国的最大底气。新时代十年的实践成就充分证明,推进高质量发展必须坚持以人民为中心的发展思想,站稳人民立场,牢记党的根基在人民、血脉在人民、力量在人民,把人民放在心中最高位置,在发展中保障和改善民生,坚定不移走共同富裕的道路。只要我们坚持发展为了人民、发展依靠人民、发展成果由人民共享,在高质量发展中促进共同富裕,就一定能够夺取经济社会发展新的更大胜利。
第三,坚持完整、准确、全面贯彻新发展理念。创新、协调、绿色、开放、共享的新发展理念是我国进入新发展阶段、构建新发展格局的战略指引。新时代十年的实践成就充分证明,推进高质量发展必须完整、准确、全面贯彻新发展理念,将其贯彻到经济社会发展全过程和各领域,彻底摒弃各类不适应、不适合甚至违背新发展理念的做法。只要我们坚持以新发展理念为指引,就一定能够解决好构建新发展格局、推动高质量发展过程中遇到的难题,推动经济发展质量变革、效率变革、动力变革,使发展成果更好惠及全体人民。
第四,坚持系统观念。系统观念是具有基础性的思想和工作方法。新时代十年的实践成就充分证明,面对错综复杂的内外部环境,推进高质量发展必须坚持运用唯物辩证法,加强前瞻性思考、全局性谋划、战略性布局、整体性推进,提高统筹谋划和协调推进能力,在多重目标中寻求动态平衡。只要我们坚持系统观念,不断提高战略思维、历史思维、辩证思维、系统思维、创新思维、法治思维、底线思维能力,就一定能够把握好全局和局部、当前和长远、宏观和微观、主要矛盾和次要矛盾、特殊和一般的关系,推动高质量发展取得新的更大成就。
没有坚实的物质技术基础,就不可能全面建成社会主义现代化强国。当前,我国发展不平衡不充分问题仍然突出,推进高质量发展还面临许多堵点、瓶颈,需不断巩固和拓展已经取得的高质量发展成果,用好在实践中获得的宝贵经验,坚定不移走高质量发展之路。
(文图:赵筱尘 巫邓炎)