DC娱乐网

当AI被用来读懂古籍

一直对古籍数字化这个话题挺感兴趣的。倒不是多懂,就是觉得那么多老书搁在图书馆和学术论文里,普通人想碰一下,门槛太高了。

前两天无意间翻到字节那份企业社会责任报告,看到“识典古籍”这块,确实被戳到了。

跟北大合作,将近6万部古籍数字化,做了个App,免费开放。不是扫个封面上传就完事了,每一部都有文白对照,逐句翻译。文言文那道隐形的墙,直接拆了。

《史记》《山海经》曾经一直在我的书单里,但打开第一页就是文言文,读三行就劝退了。一直以为是自己没耐心,直到用上识典古籍里的文白对照功能才反应过来——不是不想读,是以前根本看不懂。以前觉得“技术普惠”是个大词,但这次落得挺具体。

AI朗读是另一个让我停下来的点。火山引擎的语音技术读古籍,点开听了一段,很自然,像真人在念。古籍的断句和韵律跟现代汉语完全不一样,没处理好很容易出戏,但他们把这个细节解决了。让古籍自己发声。

古籍是慢的,一页千年。AI是快的,毫秒出结果。两件东西看似“互相冒犯”,但他们处理得很安静——AI放慢脚步,古籍被接住了。

6万部古籍,从故纸堆里端出来,擦干净,放在手机屏幕上,等人翻一翻。

我还挺吃这种技术浪漫的。不是造一个新东西惊艳所有人,而是把旧物重新带回来。

报告PDF放下面了,感兴趣的朋友可以翻翻~