风君子博客1月16日消息,1月13日下午,北京大钟寺的一个报告厅里,由抖音集团产品经理、研发工程师以及清华大学、浙江大学等高校学生组成的12支队伍正在进行决赛。5个多月前,64支队伍,501名参赛选手开启了这场“AI助力视障群体”为主题的技术公益大赛。
灵瞳产品演示图
经过三个多小时的角逐,3号参赛队伍“灵瞳”团队以最高分获得一等奖,他们设计了一款“对话式视觉助手”。这是一款应用于手机和智能眼镜的APP,初始界面类似相机。它可以听取和理解用户发起的提问,同时点击按钮录制物品信息,它会根据问题提取有效信息并语音回答。
“灵瞳”在交互和视觉技术上的表现得到了评委和观众的一致青睐。交互上,除了连续探索模式,它还可以实现指尖探索,即用手触摸屏幕来告诉用户物品的相对应位置。还有一种功能是对话定位,用户可以先告诉“灵瞳”想要什么样的物品,比如想要寻找一个红色的东西,用户可以拿着摄像头去寻找,一旦你想要的目标出现在屏幕中,“灵瞳”就会提示用户的位置,在屏幕的左侧还是右侧。“灵瞳”还有一些辅助能力,比如找对袜子,线下买衣服,“灵瞳”都可以帮助你做一些辅助信息和判断。
“灵瞳”团队的成员,一名抖音集团的研发工程师在赛后接受媒体采访时表示,他最早的触动来自于身边人——一位好友去年患上视网膜相关的疾病,接下来,他的眼睛会慢慢受影响甚至失明。从那之后,他就开始关注相关领域的技术和研发,直至这次参加比赛。
其他11支进入决赛的团队根据自身的技术特点,还提供了关于视障人群的出行、办公、购物、美妆、游戏等需求的智能解决方案。抖音公益的相关负责人表示,赛后会支持和协助有价值的项目进行孵化和落地,期待它们成为视障群体切实可用的产品。
比如“BANG”团队,他们为视障群体提供了一款无障碍的创作工具:用AI技术实现文本转图、图像编辑、色块成图等功能,支持语音交互方式,帮助视力障碍人群进行便捷创作和表达。
而“世界和平”团队则从工作场景出发,希望提供一种面向B端的“工区无障碍改造”的智能工具,为有视力障碍人群就职的机构提供无障碍化改造方案,以给视障群体提供更加舒服的办公环境。
相关数据显示,中国目前有1700多万视力障碍人士,越来越多的社会力量关注到了他们,并试图用技术和公益的方式来助力他们解决现实的困境。