历史文献的数字还原

发布时间:2023-03-25 18:50:58 栏目:生活

    导读 了解任何历史时期的最好方法之一是与经历过它的人交谈。与来自遥远过去的人交谈是非常片面的,因为他们通常已经死了,很久以前就不再听了。

    了解任何历史时期的最好方法之一是与经历过它的人交谈。与来自遥远过去的人交谈是非常片面的,因为他们通常已经死了,很久以前就不再听了。但是,如果您有耐心倾听,或者更确切地说,阅读他们在信件、日记和原始便利贴中所说的话,而没有粘性的背面,它们就会说很多话。

    来自意大利,英国和巴基斯坦的一个国际计算机科学家小组联手通过开发一种计算机辅助方法,将文件恢复到更清晰和可破译的状态,从而从随着时间的推移而退化的文字中复活死者。在发表在PLOS ONE杂志上的研究论文“通过基于色彩空间的分割对古代手稿进行修复和内容分析”中,该团队详细介绍了他们的数字修复技术的方法和实验结果。

    我们从他们的著作中了解古代文明,既琐碎又深刻。泥板上的苏美尔楔形文字揭示了 4,000 年前的商人交易、几何计算和诗歌,详细描述了一座伟大城市的衰落。如果它们是写在纸上而不是粘土上的,我们今天可能不会有它们。

    我们确实有历史学家写古代事件,因为他们自己生活在现在的古希腊。在过去的四百年里,我们有士兵在每一次重大冲突中的来信,有自工业革命以来大多数重大甚至次要事件的书面历史,所有这些都是易老化和退化的纸上写的。

    在 1980 年代后期,记录中有一个小小的空白,因为人们使用软盘来存储重要文档,几年后才将它们全部扔掉——值得庆幸的是,那些年没有发生任何重要的事情。

    阅读旧文档或旧文档,即使状况良好,也可能需要读者深入研究密码学家破译编码消息的角色。不是因为作者试图故意对他们的文本保密,而是因为作家的识字能力、笔迹易读性、刻字风格、过时的拼写和语法惯例或为节省空间而使用的临时缩写的组合甚至会使母语看起来不熟悉。

    拿同样的文档,通过褪色墨水、扩大湿气暴露的字体、渗出或将颜料从一页转移到另一页以及将信息重新组合在一起来进一步降低其可读性可能成为一项真正艰巨的任务。

    当前工作与过去方法有很大不同的一个方面是颜色的使用。典型的数字重建将文档转换为白色背景上的黑色文本,试图通过噪声过滤和对比度增强来显示文本。在当前的颜色方法中,图像更多的是恢复工作,保留了原始文档的大部分外观和虚拟感觉。

    研究人员应用了几种数字色彩解释技术和高斯混合模型的复杂集成来识别和分离文本、纸张和伪影的特征。这允许根据有时微妙的光谱差异选择性地提取不同层次的信息。因此,用户可以通过添加或删除图层来决定潦草的符号、页面装饰、印章、咖啡杯环污渍或其他特征是否对理解至关重要。

    在某些情况下,该技术可以保留原本会丢失的特征,例如纸张制造商的微弱水印,这可以为历史学家提供重要的见解。例如,列奥纳多·达·芬奇(Leonardo da Vinci)的著名作品在完好无损的情况下幸存下来,不属于当前研究的一部分,这些作品写在带有水印的页面上,这些水印来自各种纸张供应商,允许文献历史学家将它们分组到可能的写作时期。

    根据该论文,处理可以在标准台式计算机(Core i5,4 GB RAM,Windows 10)上完成。该算法只需几分钟即可将文档虚拟恢复到更高的易读性。这种程度的用户友好性将使其成为历史文献研究人员和试图破译旧家庭食谱的人的绝佳工具。

免责声明:本文由用户上传,如有侵权请联系删除!