Một mô hình AI của Google có thể “điền khuyết” cho các bản khắc La Mã 2000 năm tuổi
Cách làm này tuy khoa học nhưng rất mệt mỏi và không ai có thể tra cứu hết tất cả, hơn nữa kiến thức của mỗi nhà khoa học cũng khác nhau. Nên mới đây Google DeepMind đã phát triển một công cụ AI gọi là Aeneas có thể điền vào những chữ còn thiếu trong các bản khắc đó, không chỉ là trên các di tích mà còn là cả những dòng chữ có trên các vật dụng thường ngày như chai, lọ, bàn ghế. Nó dự đoán vị trí và khung thời gian mà những chữ này được khắc, từ đó đưa ra gợi ý về các từ còn thiếu.
Aeneas là thành quả phát triển của sử gia Thea Sommerschield đến từ Đại học Nottingham, phối hợp cùng đội ngũ của Google DeepMind. Nó sẽ hỗ trợ các nhà khoa học phục hồi những văn bản cổ bằng tiếng Latinh nhằm giúp chúng ta biết thêm về đời sống, văn hoá và phong tục thời cổ đại. Chúng do những người thuộc nhiều tầng lớp xã hội viết và xuất hiện ở khắp nơi từ những chữ được khắc trên tường thành, sắc lệnh của Hoàng đế, tranh vẽ, thơ ca, hồ sơ làm ăn cho đến bia mộ. Người ta ước tính mỗi năm có khoảng 1500 bản khắc mới được tìm thấy ở nhiều vùng từng thuộc Đế quốc La Mã.
Sự tàn phá của thời gian đã khiến những bản văn này hao mòn, nhiều khi bể nát nặng tới mức không đọc nổi. Mặt khác nhiều hiện vật còn lưu lạc từ nơi này qua nơi khác, nên là nơi tìm thấy cũng chưa chắc là “nguyên quán” của chúng. Để ‘dọn cỗ sẵn’ một kho thư viện cho các nhà nghiên cứu, Aeneas được đào tạo từ cơ sở dữ liệu khổng lồ gồm 176 ngàn chữ khắc La Mã đã biết trước, tương đương khoảng 16 triệu ký tự.
Giống như cách một chuyên gia thường làm, Aeneas sẽ lấy văn bản (đôi khi hình ảnh) từ bản khắc đang cần nghiên cứu và vận dụng “hiểu biết” của mình nhằm tạo ra một danh mục các bản khắc có liên quan. Cuối cùng nó đưa ra kết quả chẳng những là các từ còn thiếu, mà còn chỉ ra văn bản đó có nguồn gốc ở đâu trong số 62 tỉnh của La Mã với khung thời gian nằm trong khoảng từ thế kỷ 7 TCN cho đến thế kỷ 8. Nghe có vẻ đơn giản, nhưng các sử gia đương nhiên là không thể tự mình đối chiếu nổi hàng chục ngàn bản khắc để tìm những điểm giống nhau, trong khi Aeneas chỉ mất vài giây.
Người ta đã làm một số thử nghiệm để kiểm tra năng lực của Aeneas. Chẳng hạn trên một bản khắc mang tên Res Gestae Divi Augusti nằm ở một đền thờ tại Ankara (Thổ Nhĩ Kỳ), có nội dung thuật lại những thành tựu của Hoàng đế Augustus (63 TCN-14), Aeneas đã đưa ra hai khung thời gian khả thi mà văn bản này được ghi lại: hoặc là từ năm 10 đến năm 1 TCN, hoặc từ năm 10 đến 20. Điều đáng kinh ngạc là chính các nhà sử học cũng đang tranh cãi về đúng 2 khung thời gian đó từ trước rồi. Aeneas cũng phân tích các chữ khắc trên một bàn thờ tại Mogontiacum (Đức) và kết luận rằng nó chịu ảnh hưởng từ một bàn thờ cổ hơn trong cùng khu vực, nhờ những nét tương đồng cực nhỏ trong ngôn ngữ giữa 2 bàn thờ.
Aeneas sẽ giúp các sử gia làm việc hiệu quả hơn và thậm chí biến đổi sâu sắc cách thức mà họ làm nghiên cứu. Nhưng nói gì thì nói, không có gì là tuyệt đối và Aeneas vẫn có thể sai lầm, đưa ra những hiểu biết sai lạc so với sự thật lịch sử. Quyết định sau cùng vẫn nằm ở chúng ta: các chuyên gia phải xem xét những dự đoán nó đưa ra và đánh giá coi cái nào khả thi nhất.