奥地利打造首个古希腊语AI大模型

发布时间:2026-03-21 04:05  点击:1次

奥地利科学院(ÖAW)近日宣布,将利用人工智能技术深度赋能古希腊语研究,这一举措标志着古典学领域迎来数字化里程碑。该AI系统旨在通过智能文本检索、自动补全残缺内容以及重构严重损毁的文献,为学术界提供前所未有的研究工具。

据悉,该大型语言模型(LLM)的训练数据规模宏大,涵盖了约6亿个单词的历史文本,以及数万件已出版的铭文和纸草文献。这是迄今为止全球规模最大的古希腊语历史数字语料库。项目由奥地利科学院考古研究所的古希腊历史学家兼纸草学家安娜·多尔加诺夫(Anna Dolganov)领导,她强调,该项目是全球首个面向古代历史语言的先进多模态大模型,其技术架构和训练数据量均超越了现有同类项目。

在基础设施方面,项目选择了欧洲本土的Mistral AISAIL Reply两家公司合作,以确保构建符合欧盟严格数据隐私和安全标准的欧洲云基础设施。这一选择不仅保障了学术数据的安全,也体现了欧洲在关键数字技术领域的自主可控决心。奥地利科学院院长海因茨·法斯曼(Heinz Faßmann)指出,古老语言与人工智能并非对立,而是相辅相成,新模型将极大提升对残缺文本的理解能力,从而深化人类对共同历史渊源的认识。

该AI系统的潜力巨大,能够处理从修复残缺铭文、纸草文献,到进行语义主题检索,乃至识别人手书写的古文字等多种复杂任务。多尔加诺夫透露,全球范围内仍有约100万份古希腊纸草文献从未被人类阅读过,其中数万件珍藏于奥地利国家图书馆的纸草收藏中。这一AI工具正是为了挖掘这些沉睡的历史知识宝藏而生。

对于中国学术界而言,这一案例极具参考价值:将AI大模型应用于小语种或古文字研究,是打破文献阅读瓶颈、实现“古籍活化”的有效路径,中国庞大的出土文献资源同样值得探索此类技术赋能的可能性。

吉林省智教软件有限责任公司

联系人:
吴楠(先生)
手机:
18643191762
希腊语新闻
拨打电话 请卖家联系我