首页 科技内容详情
kiếm tiền online uy tín(www.vng.app):Meta 台湾工程师陈鹏仁分享闽南语直接翻译成英语的技术背后故事 (184488)

kiếm tiền online uy tín(www.vng.app):Meta 台湾工程师陈鹏仁分享闽南语直接翻译成英语的技术背后故事 (184488)

分类:科技

标签: # 赌三公大吃小怎样才稳赢钱

网址:

SEO查询: 爱站网 站长工具

点击直达

kiếm tiền online uy tín(www.vng.app):kiếm tiền online uy tín(www.vng.app) cổng Chơi tài xỉu uy tín nhất việt nam。kiếm tiền online uy tín(www.vng.app)game tài Xỉu đánh bạc online công bằng nhất,kiếm tiền online uy tín(www.vng.app)cổng game không thể dự đoán can thiệp,mở thưởng bằng blockchain ,đảm bảo kết quả công bằng.

,

目前参考资料多半来自台湾学术单位,以及多个台湾闽南语连续剧内容,因此目前训练模型所对应使用闽南语,会更像是台湾地区使用的闽南语,就连翻译后的念音也更像是台湾腔。

针对Meta日前提出全球首款以语音对语音翻译,让闽南语能直接翻译成英语的技术,参与此专案开发的台湾工程师陈鹏仁透过线上形式分享更多此项技术背后故事。

因为开发团队有很多人熟稔闽南语,因此选择以此作为第一个开发翻译语言

陈鹏仁说明,最初在此专案选择以闽南语作为第一个开发翻译语言的原因,其实在于开发团队有不少熟稔闽南语的同仁,因此可以在更快时间验证翻译结果是否正确、通顺。

▲UST技术实际运作架构

而为了打造能直接以语音对语音的翻译技术,多达50人规模的开发团队除了工程师,还包含语言学者与社会学家,以及伦理学家与诸多跨学术团队成员,借此研究目标翻译语言背后结构与文化影响,例如美国所使用的英语与英国地区的英语虽然互通,却有不少用字遣词,或是发音上的差异。

而闽南语其实也有类似情况,光是在台湾、中国福建沿海地区,以及马来西亚、新加坡等地所使用的闽南语就有不少差异,甚至闽南语还有七声八调的不同,而在台湾也有明显的南腔北调情形。


此外,闽南语实际上没有标准化的文字系统,加上各地区发音用词上的差异,更让这个原本是以口语相传为主的语言,更难以制式翻译方式转换成其他语言。陈鹏仁表示,实际上也是开始投入开发之后,才发现要顺利将闽南语翻译成其他语言,真的比想像中还难。

与台湾学术单位合作语库,因此翻译结果会有台湾腔

先前说明中,Meta是透过闽南语的念音转换成数位资料,并且将这些资料进行分类、标示,并且透过机器学习训练,让其他语言可以对应合适翻译结果。若其中有无法直接翻译,或是难以呈现精准意思的情况,系统就会透过其他相近语言进行翻译,并且将翻译结果转换成目标语言。

此项专案也与台湾相关机构合作,其中包含使用Taiwanese Across Taiwan建立长达300小时长度的台文语音语料库,借此建立第一个闽南语与英语双向语音翻译基准资料集,由于参考语库含大量闽南语念音资料与可供对照的中文字幕内容,因此可以利用机器学习方式建立闽南语念音与中文之间的翻译结果,并且可再利用中文翻译结果转换成英语,实现将闽南语翻译成英语。

▲台湾工程师陈鹏仁

至于目前参考资料多半来自台湾学术单位,以及多个台湾闽南语连续剧内容,因此目前训练模型所对应使用闽南语,会更像是台湾地区使用的闽南语,就连翻译后的念音也更像是台湾腔。陈鹏仁解释,这主要还是取决训练时所采用参考语库内容,由于目前用于学习的语库多半来自台湾,因此训练成的语言模型自然就会有台湾腔。

发布评论