尝试实现公文完全自动化——ChatGPT、Claude、kordoc + python-hwpx
韩国公共机构至今仍然大量使用扩展名为 .hwp 的文件。这种文件是韩文和计算机公司打造的自有规范文档格式。问题在于,这种格式并不能与其他程序做到完全兼容。要把文档“打开来看”当然是可以的。但要能以结构化的方式读取其内容,并像数据一样加以利用,那又是完全不同的问题。而恰恰在这一点上,它成了在用 AI...
韩国公共机构至今仍然大量使用扩展名为 .hwp 的文件。这种文件是韩文和计算机公司打造的自有规范文档格式。问题在于,这种格式并不能与其他程序做到完全兼容。要把文档“打开来看”当然是可以的。但要能以结构化的方式读取其内容,并像数据一样加以利用,那又是完全不同的问题。而恰恰在这一点上,它成了在用 AI...

在第一次接触网页开发大约 1 年之后,我开始想着想要拥有一个属于自己的博客。于是我就大概花了 6 个月几乎只埋头做这件事。前端部分的功能,参考金度亨先生的博客就已经足够了。我用 mdx 搭建起一个博客,其实连一周都没花到。事实上,仅靠前端也并不会给博客运营带来什么大问题。有一阵子我也觉得,只要写 m...

每次一有想在主页上加点什么的念头就去 build,结果中间好像偶尔会有人访问。于是 Search Console 上的分数开始一点点往下掉。觉得这样不行,就开始思考要怎么做无停机部署。1. 两个项目文件夹 + 两个终端答案出乎意料地简单:开两个终端。在一个终端里 build,另一个终端里让服务器跑着...

继上次搞完 IndexNow 之后,也决定在谷歌这边做一下自动化。查了一下,发现谷歌是通过一个叫 Web Search Indexing 的 API 来支持这个功能的。1. 适用范围官方文档中,这个 API 正式支持的范围是招聘公告和流媒体视频服务。说是为了给对实时性要求高的内容创建索引用的,但搜了...

在向 Bing 提交站点收录时才发现,Bing 提供了一个叫做 IndexNow 的功能。核心在于,可以利用 API Key,在写完文章的瞬间就立刻发起索引请求。只要用 fetch 写出类似下面这样的请求,并把它串联到「写文章」流程里,就可以在把文章保存到 DB 的同时发送索引生成请求。POST /...

我最初接触到这次安全问题是在 12 月 5 日凌晨。据说在 React 中可以在未认证的情况下进行远程代码执行。看到这条新闻后,我虽然告诉了别人,但总觉得自己应该没事,就什么想法也没有地略过了。1. 发现被入侵的痕迹结果当我想登录更新博客代码时,在终端里发现了有命令被执行过的痕迹。/bin/sh:...