奥地利打造古希腊语AI模型

奥地利科学院（ÖAW）近日宣布，将利用人工智能技术深度赋能古希腊语研究。该计划旨在通过文本检索、自动补全及受损文本重构等核心功能，解决历史文献研究中长期存在的断章缺句难题，为古典学研究开辟全新路径。

该项目核心在于构建一个超大规模语言模型（LLM），其训练数据源自约6亿个单词的历史文本，涵盖数万条已发表的铭文与纸草文献。这是目前全球规模最大的古希腊语历史数字语料库。项目由奥地利科学院考古研究所的**专家安娜·多尔加诺夫（Anna Dolganov）领衔，她指出，这一规模在同类历史语言项目中尚属首次。

值得注意的是，这是全球首个面向古代历史语言的先进多模态大模型。相比之下，其他同类项目往往基于不同的技术架构且训练数据量较小。为确保数据安全与隐私合规，项目将依托欧洲本土基础设施，由法国企业Mistral AI和意大利企业SAIL Reply提供支持，构建符合欧盟严格数据保护标准的计算环境。

该AI系统的应用场景极为广泛，不仅能重构残缺的铭文与纸草，还能进行语义主题检索及手写体识别。多尔加诺夫强调，全球现存约100万份从未被阅读过的古希腊纸草文献，其中数万件珍藏于奥地利国家图书馆。这些沉睡的历史宝藏正是该项目的核心攻关目标。

奥地利科学院院长海因茨·法斯曼（Heinz Faßmann）表示，古老语言与人工智能并非对立，而是相辅相成。该项目命名为“阿波罗”（Apollo），将显著提升对残缺文本的理解能力，进而深化人类对共同历史根源的认知。对于中国学界而言，这一案例展示了AI技术在非通用语、小语种及古籍数字化领域的巨大潜力，提示我们关注多模态大模型在抢救性保护人类文化遗产中的战略价值。

奥地利打造古希腊语AI模型

上海起秀网络科技有限公司