南京高校教授团队推出“非遗”大语言模型
2024-10-17 10:55  来源:南京晨报  作者:黄阳阳  
1

日前,南京大学与全国名词委“术语与翻译跨学科研究”基地携手南京农业大学信息管理学院的王东波教授团队,在非物质文化遗产(以下简称“非遗”)保护领域取得了突破性进展,其团队成功推出了全国首个非遗领域大语言模型,为非物质文化遗产的数字化保护与传承开辟了新的道路。

非遗作为中华民族宝贵的精神财富,长久以来主要依赖口头传播和经验传授,面临着随时间流逝而逐渐消失的风险。为了有效应对这一挑战,王东波教授团队首次推出的非遗大语言模型,推动非遗的数字化、知识化和系统化,为非物质文化遗产的数字化保护提供了强有力的技术支撑。

王东波教授告诉记者,在构建非遗大模型的过程中,研究团队面临了非遗数据独特性和复杂性的挑战。为确保模型能够精准理解和运用非遗领域的独特知识,团队深入中国非物质文化遗产网,从机构、政策、资源、咨询、学术五大板块获取并整理了海量数据。此外,还充分利用了学术文献数据库中的非遗相关期刊论文摘要,构建了一个内容丰富、体量庞大的非遗领域预训练数据集。这一数据集的构建,为非遗大模型获取领域知识奠定了坚实基础。

王东波教授表示,为了使模型更好地理解和响应非遗相关问题,研究团队结合前期获取的数据,构建了面向非遗领域的知识实体标注方案,并经过长期的人工数据标注与校验,实现了非遗数据知识实体的精细标注。据了解,王东坡教授团队还依托超大型语言模型,对已有非遗文本数据进行了转换与增强,构建了高质量的领域知识对话数据,为大语言模型在非遗领域的深入应用提供了有力支持。

值得注意的是,在南京农业大学高性能算力平台的支持下,研究团队训练了非遗领域基座大模型,并进一步构建了非遗对话大模型。基座大模型的推出为大模型技术在非遗领域的深入应用奠定了基础,而对话大模型则让更多非遗知识的研究和学习者能够更加便捷地获取非遗相关知识,为非物质文化遗产的推广与挖掘提供智能技术支持。

王东波教授认为,非遗对话大模型的推出,不仅实现了非遗的自动化传播与知识普及,还通过其强大的跨语言能力,打破了语言障碍,有助于非遗走向国际。同时,该模型还能为非遗传承人提供更加便捷的技术支持,使他们能够更好地利用新技术实现非遗的创造性转化。借助大语言模型在非遗基础上进行文化再创造,深入挖掘非遗中蕴含的精神财富,结合知识图谱技术对非遗进行知识化存储,有助于研究人员更系统地研究非遗的内在逻辑和传承脉络。

标签:
责编:王玥