我正在研究设计一个软件平台,可以帮助语言学家和人类学家研究以前未研究的语言。统计数据显示,大约有1000种语言存在,这些语言从未在其各自演讲人群之外进行过研究。IPA(国际音标字母)用Tensorflow转录
我的目标是利用TensorFlow创建一个平台,让语言学家能够更有效地学习和记录这些语言,并帮助他们为没有书面系统的人创建书面系统。他们目前完成这项任务的方法之一是三方面的:1)记录一位母语人士在语言中交谈,2)聆听该录音并试图将其录制到IPA中,3)从语音学分析语音学和语言的语音音调,最终为演讲者创建一个书面系统。
我建议的平台会将研究时间从最少一年减少到最多六个月。在我开始之前,我有一些问题...
培训TensorFlow将现场音频转录到IPA需要什么?这已经完成了吗?如果是这样,我将如何利用此项目的先前解决方案? TensorFlow甚至可能有这样的项目吗?如果不是,你会推荐使用什么?
我对这个问题的严重性表示歉意。我在机器学习领域没有太多经验,因为我刚开始研究这个项目的过程。任何帮助表示赞赏!
你是否和一位语言学家讨论过这个问题?音素识别可能比识别单词困难得多https://cmusphinx.github.io/wiki/phonemerecognition/ – Aaron
@Aaron在技术上,它是*电话*在这里,而不是音素,但不知道它是否使它更好... – lenz