在多语言文本处理时,作者因使用 NFKD 规范化导致韩文字符被过度分解,影响了文本分类效果。这篇博文分享了 Unicode 规范化在韩文上的坑点,并提醒在 NLP 任务中需谨慎选择字符规范化方式。[ChatGPT 4o]
阅读全文本文介绍如何使用GitHub Actions自动发布Hexo博客,包括本地调试、配置密钥、设置GitHub Actions触发条件、环境配置、依赖安装及Hexo部署。文章还提供了解决可能遇到的问题(如HTML空白)的策略,使博客发布更高效。[ChatGPT 4o]
阅读全文