人民网
人民网

阳江方言大模型系统研究课题启动

2025年04月16日10:21 |
小字号

随着人工智能应用领域的拓展,地方方言正在成为大语言模型应用探索的重要领域。日前,广东海洋大学阳江校区计算机科学与工程学院副教授邓超与4名博士牵头组成团队,启动了阳江方言大模型系统研究课题。

这是广东海洋大学阳江校区成立后首个自然语言处理人工智能研究课题,引起了社会的广泛关注。该课题将立足阳江方言现状,探索阳江方言保护、传承与利用的新路径,让承载着乡土记忆的阳江话以更鲜活的形式融入当代生活,焕发生机与活力。

创新探索“AI+方言”

有望实现多场景应用

在广东海洋大学阳江校区的阳江信创产业创新中心里,研究人员正专注处理方言数据。

“来到阳江工作后,我发现语言不通给我的生活带来许多不便,同时我也注意到了许多外出求学的年轻人对方言日渐陌生。”邓超说,团队中既有“新阳江人”对方言隔阂的切身感受,也有土生土长的成员对乡音的深厚情怀,这促使大家“一拍即合”,共同开启了这场科技攻关。

据介绍,当前如粤语、上海话、四川话等使用人口较多的大方言研究较为充分,而阳江话这类使用人口较少的次方言研究相对较少,这也使得团队的研究更具价值。

“我们希望通过AI让阳江话‘活’起来,既应对保护和传承挑战,也为人工智能赋能民生服务提供实质性应用,助力提升工作效率与质量。”作为从海外学成归来的阳江学子、人工智能领域博士刘炳尧也积极开展本课题的研究工作。

如何开展研究?课题攻关需先采集大量数据,对数据进行标注分类,接着训练优化模型,使其达到一定的准确度和识别率。在这个过程中,大模型需要不断“在学中用、在用中学”,通过持续循环迭代提升精度,待成熟后即可部署实测,并依据反馈持续优化,最终形成产品级应用系统。

目前,团队已提出多项应用设想,例如,开发阳江方言智能助手,为12345政务服务便民热线、医疗以及教育等民生领域提供方言交互支持;结合文旅产业开发虚拟导游、方言文创产品,助力乡村振兴;生成方言社交内容,促进本土文化传播,增强阳江人的文化归属感。“我们相信模型的上线,将为阳江社会经济和文化发展注入新动能,更好地服务当地市民群众。”团队成员充满期待。

多措并举收集“教材”

多向发力整合资源

实现从“0”到“1”,过程并不容易。要让AI“听懂”方言,首先要给它当“语言老师”。为此,团队通过多种形式收集“教材”,积累了不少素材:组织在校的本地学生志愿者参与方言音频录制、与市12345热线合作“淘”出真实的通话样本……

“数据采集是基础,既要捕捉方言特有的音调韵律,更要确保样本覆盖不同年龄层、性别、语速的发音特征。”刘炳尧介绍,阳江方言细分不同的区域又有所区别,数据采集工作量大,需要耗时耗力。接下来团队将继续扩大采集范围,通过更多渠道丰富数字语料库,提升识别准确率,为模型训练夯实基础,“我们的想法是构建统一的大模型,后续经阳春、阳西等各区域的方言语料训练后,让其适应地域差异。”

仅有海量数据还不足以确保AI对方言的精准理解。在研究室的桌面上,《广东阳江方言研究》《阳江音字典》两本书籍格外引人注目。“就像教孩子认字需要标准课本,AI学习方言也离不开权威词典的专业支撑。”邓超解释,类似翻译中“英汉互译”的原理,构建阳江方言语料库也需要词典作为参照范本,确保方言的词汇、发音符合标准,与普通话实现对齐。目前,团队已收集上万条中文文字数据集,音频数据已录制5000个词语、1000条句子。

技术攻关的另一头是资源协调的挑战。“课题的顺利开展离不开资金、资源的投入。”邓超介绍,方言识别需要大规模算力支撑,团队正与算力平台企业和三大运营商对接,积极争取算力资源的支持;同时,广东海洋大学阳江校区正在筹建人工智能实验室,团队也将争取相应的资源支持。

期待社会多关注

激活方言生命力

一直以来,阳江方言的保护传承与开发利用受到我市社会各界的积极关注。当下,AI技术的介入,不仅为方言保护提供了数字化解决方案,更引发了关于如何让方言在数字时代焕发新生的深层思考和探索。

得知团队正在做方言保护和传承工作,著名语言学家黄伯荣教授的女儿黄绮仙慷慨赠予《广东阳江方言研究》《阳江音字典》学术专著,为研究提供了系统的语言学理论支持。

“保护和传承阳江方言是父亲的心愿,希望通过提供基础研究资料为课题的开展给予帮助,同时也为家乡方言的保护和传承出一份力。”黄绮仙认为,这种将前沿技术与方言保护相结合的创新探索,值得大力支持,能引起更多人关注和重视阳江方言。她期待有越来越多年轻人参与其中,拿起“接力棒”,利用新技术更好地保护、传承和利用阳江方言。

“借助AI技术研究方言,是保护和传承的一种新形式。当前有许多本地青少年不了解或少使用阳江方言,通过这种契合青少年喜闻乐见的形式,有望引起他们对方言的兴趣和关注,实现在‘指尖’学习方言。”阳江语言研究学者容慧华介绍,目前已有不少学者做了大量基础工作,积累了一定的知识和经验,研究人员可以立足原有的研究、利用现有的资源开展工作,实现方言的保护传承和本土化的服务利用。

对于中国人来说,方言是乡情乡愁的重要寄托。如今,“让世界听懂阳江话”的课题愿景,正随着人工智能时代的来临照进现实。当AI工具开始“识读”阳江话,承载着乡愁与记忆的声音将以更鲜活的方式,回荡在漠阳江畔,连接过去与未来。

(责编:宁玉瑛、张永生)

分享让更多人看到

返回顶部