照片是Facebook和其他社交媒体平台上最常见的共享内容之一。
尽管大多数社交媒体用户都可以理解图片并理解图片的含义,但对于盲人或视力障碍者而言,这并不是一件容易的事。
Facebook表示,屏幕阅读器可以使用合成语音来描述这些图片的内容,从而使盲人或视力障碍的用户能够理解Facebookfeed中的图片。
但是,许多照片在发布时都没有替代文本,导致Facebook在2016年引入了自动替代文本(AAT)。
这项技术使用对象识别技术为盲人或视障用户按需生成照片描述。
自2016年以来,Facebook一直致力于改善AAT,并于近期推出了下一代技术。
Facebook在AAT方面的进步改善了用户的照片体验,而AAT可以可靠地检测和识别照片中的概念数量已扩展了十倍以上。
这意味着更少的没有描述的照片和更详细的描述。
AAT可以识别活动,地标,动物类型等。
AAT现在将给出以下描述:“它可能是两个人的自拍照,在户外,比萨斜塔”。
Facebook还表示,能够在照片中包含有关元素的潜在位置和相对大小的信息是业界首创。
它并没有简单地描述“可能是五个人的合影”。
但是,由于“两个人在照片的中央,而其他三个人分散在边缘”。
Facebook表示,这项进步可以帮助盲人或视障用户更好地了解家人和朋友发布的照片中的内容。
最新版本的AAT使用对数十亿张公共Instagram图片和标签数据进行训练的模型。
训练后产生的模型在文化和人口统计方面更准确,更宽容。
改进的AAT可以可靠地识别1200多个概念。
负责编辑AJX