目录

  1. 房子
  2. 孩子
  3. 车子
  4. 牛子
  5. 野子
  6. 乐子
  7. 结语
  8. END

2024 马上就要过去了,真的好快!

不知道从什么时候开始,我也开始有每年底写一个年度回顾的想法。哦对了,应该是从网易云音乐的年度回顾开始。

回想这一年来发生了什么,有哪些收获,有哪些感想,获得了什么,失去了什么。从哪里开始呢?就从最大的事情开始吧。

房子

房子属实是意外,本没有打算今年买房,但是奈何政策变化太快了,各种利好政策纷至沓来,然后就看了看,然后就买了 😂。具体可以看我之前的写的买房记,在这里就不赘述了。

孩子

今年迎来了我们的第二个孩子,这个确实是计划之中。我觉得两个孩子是最佳的状态,既不多也不少,1 个孩子略显孤单,3 个孩子略显嘈杂。

但是生第二个孩子的代价,是很大的,尤其是像我们这种两个孩子相差 3 岁的情况。俗话说,terrible 2 horrible 3。两三岁这个年龄的孩子,精力极其旺盛,探索欲极其之强,总想搞点大事情,在家里根本闲不住。然而这时候家里迎来一个刚出生的孩子时,需要一个安静的环境,这就造成了冲突和矛盾。这种冲突简直会让你崩溃,我们家还是父母在帮忙照看的情况,如果没有父母照顾,简直难以度过这段艰难的时期。

说到这里,在 2 岁多的时候,让孩子去上托班,是一个不错的选择。这样几乎可以避免上述冲突。但是恰巧我们想让老大去上托班的时候,正是冬季。然后冬季是流感高发期,去上托班就意味着大概率会生病,然后将病毒带回家,然后传给老二,这是我们非常不愿意看到的。所以还是选择年后送去托班。

总之,想要生老二,最好让两个孩子年龄避开 3 岁这个尴尬的差距。将来两个孩子有可能同时处于升学关键期:中考和高考。

车子

北京的摇号政策是在太恶心,2024 年 第二期摇号意料之中的落空,320 万申请者(包括家庭和个人),9600 个指标,粗略算下来,平均摇中概率只有 0.3%。排新能源车也是遥遥无期,model y 算是这两年买不到了,不过 2025 年要出新款了,所以算是塞翁失马?

四轮车买不了,两轮车还是可以买的。在搬家前那段时间,买了一辆九号 F90。这辆小车,在搬家前后可是帮了大忙,省了不少打车钱。自从有了它,后来打车次数直线下降,短途出行全靠它。后来天气渐冷,才逐渐开始打车。不得不说,春秋季,简直是电动车的黄金时期,骑着车吹风太舒服了。

牛子

什么是牛子?牛马……哈哈哈,只是为了强行与上面对齐,又不能叫马子,只能叫牛子了。我是做 NLP 的,但模型工作在今年只占一小部分,今年的很大部分工作,都是工程上的问题,有很多我之前我没接触过或者了解不深的东西,比如 Kafka、redis 以及 ToC 产品的生产代码编写和性能监控。

与此同时,LLM 大爆发,无论是国内还是国外,此起彼伏。LLM 的使用门槛越来越低,价格越来越便宜,对 NLP 工程师可能是个挑战。以前我们训练一个分类模型,可能真的需要 NLP 工程师的参与,毕竟编写处理数据和训练代码等还是有一定门槛的。但是现在,只要你把类别列表、待分类文本扔给 LLM,一次 API 调用,就可以得到一个不错的结果,如果你用的是 gpt-4o 等高阶模型,那么你的效果更不会太差,你甚至都不需要微调(而且微调成本较高,效果也不一定好)。所以说你只需一个传统的 Java 工程师即可,甚至是一个实习生!平权正在发生!

但是话说回来,如果你是调用 LLM API 来使用,那么在发生分类错误时,即 LLM 始终对一些文本分错类,那么此时你基本无法去优化,你能做的只有调整 prompt 或等待模型升级。如果你使用的是本地部署的 LLM,那么要么较小模型效果不好,要么较大模型成本较高,微调费时费力,还不一定有提升。而使用“传统”模型(是的,BERT 这种现在也只能说是传统了),你有更为灵活的模型优化方法和更快的推理速度。对于摘要等生成任务,我认为目前最佳做法仍然是 LLM,但是注意幻觉问题,强如 Apple,也会闹出胡说八道的笑话。

下一年希望继续增强自己的工程能力和算法能力,阅读更多的论文,理解更多的概念,写出更多的博客!

野子

即牛子之外的探索。今年探索了几个项目,主要是:

  • Video Translator:上传一个视频,自动加上中文字幕。这个其实没啥核心技术含量,主要就是 ffmpeg + whisper。希望接下来加上 GitHub 自动打包发布(docker),使其更易用。
  • 声音克隆:这个目前还未公开。这也是我第一次实际训练音频模型,使用的是 xtts_v2,声音是柴知道之前的女性声音,使用了大概 5 分钟的声音,走了一下从音频获取到模型部署的全流程,收获不少。虽然 xtts 本身支持直接根据 reference audio 进行克隆,但是训练过后发现效果更好。
    从音频获取到模型部署全流程从音频获取到模型部署全流程
  • til:记录日常遇到的不足以形成一篇完整博文的小问题、小技术点,实际上就是小笔记,之前我的笔记都在 GitHub 和 Notion 上。灵感来自 simonw/til 。希望新的一年继续坚持!
  • 博客自动发布。利用 GitHub Action 的能力,在 GitHub 上直接编辑博客,提交之后执行 action,build and deploy。详见使用 GitHub Actions 自动发布 Hexo 博客

乐子

根据豆瓣统计,今年共看过 79 部影视。直观上感觉这个数量明显低于去年,主要还是今年太忙了。而且今年国内上映的感兴趣的电影不多。

沙丘 2洛基 2幕府将军美国内战凡人歌异教徒Devs人生复本终极名单Reacher豺狼的日子等,是值得点出来的,后三个([-3:]),我称之为“孤胆硬汉大杀四方”,只不过硬汉的风格不同。

[-4:-6] 是非常不错的关于平行宇宙和薛定谔的猫的片子,Devs 中的理念:Everything is predictable,在当下 LLM 盛行的年代,岂不就是 AGI 的另一种表达?我也认同这句话,有些东西我们现在看起来是不可预测的,但是否是我们对其了解的太少?特征不够多?

结语

回顾 2024 年,买房和老二出生是大事,生活上忙忙碌碌,工作上也忙忙碌碌,技术上也有所探索和收获,但博客发表量太少,太多仍在草稿阶段。希望 2025 年继续提升技术,继续推进现有的一些个人项目,发表更多的博客!Don’t think. Just do it!

Happy coding, Happy blogging, Happy NEW YEAR!

END