获得徽章 9
用了一年多,终于在业余时间摸索出个人微调的三个 LLM 分别实现多模态识别视频课件,多模态添加字幕,还有英中单模态翻译,准确率已经有点高的可怕了,后续应该基本不需要我人工干预了,可以专心享受技术视频了。但是微调的成本确实也很高,我在大部分使用本地电脑(顶配 Mac M2)试错的情况下,尽量减少云微调的次数,还是花了 2w USD。最近在公司内部推广使用 AI 优化需求,也是必须用 RAG 压缩成本,否则太贵了。下一步优化就不从微调去做了,而是将识别的保存在向量数据库,并拉取各种 release note 辅助识别,优化新技术名词出现的识别,估计又得业余摸索几年。

一个识别的例子:www.bilibili.com
展开
hashcon于2024-04-09 08:52发布的图片
1
Java 22 终于引入了关于 JVM Native Memory Tracking 的 JFR 事件,这样看统计还有趋势就更好看了,元空间,GC 占用内存(比如 CardTable),stringtable,internal 内存等等都更容易看出趋势了。但是通过 JNI 分配的内存(比如 Java DirectBuffer, MMAP Memory 等等)还是无法通过 JVM Native Memory Tracking 看到,估计等 Panama 一统堆外原生内存管理江湖之后,就能看到了。
关于 JVM Hotspot 内存哥块底层原理可以看这个系列:juejin.cn
展开
hashcon于2024-02-26 11:58发布的图片
hashcon于2024-02-26 11:58发布的图片
评论
把自己之前做的视频,还有写的文章,喂给 mistral 的还有 huggingface 上的几个针对性模型组合微调了下,用自己的 m2 96g 跑的,主要针对长文本,视频识别,以及技术语料进行优化,效果还可以。之后会进一步拓展领域,继续优化模型。
hashcon于2024-02-16 17:54发布的图片
hashcon于2024-02-16 17:54发布的图片
hashcon于2024-02-16 17:54发布的图片
hashcon于2024-02-16 17:54发布的图片
7
其实池化死锁的根本原因都是不规范,但是业务开发,随着项目越来越老,迭代越来越多,微服务越拆越多,很难避免写出出现这种问题的代码。尤其是,随着模块化越来越细致,每个人都专注于自己这一块,就更容易出现,a 调用 b,b 在同一个接口还调用了 a 的另一个接口,当 a 或者 b 性能出现问题,a 的所有 servlet 线程,等待 b 调用返回,但是 b 又调用 a 无法响应。在池化死锁这一点上,java 虚拟线程还是解决了不少问题。
展开
hashcon于2024-02-13 18:16发布的图片
hashcon于2024-02-13 18:16发布的图片
hashcon于2024-02-13 18:16发布的图片
评论
用了 IDEA 的 JFR 视图,它主要针对采集的 method sample profile 和 native method sample profile 做了火焰图,热点调用堆栈等等视图,并且和源码能对应上,源码处也有出现次数,很容易找到性能瓶颈或者性能热点去优化,比如笔者前一阵子发现的升级 Spring Boot 3.x 接入 Mcrometer 之后,尽量避免使用默认的 ObservationHandler 否则性能消耗太大,参考笔者提的 issue: github.com
展开
hashcon于2024-02-05 07:34发布的图片
2
试用Ottertune以及Akamas这两个AI自动数据库调优工具有感
OtterTune 和 Akamas 都是主要针对数据库的自动参数优化工具,它们使用人工智能和机器学习技术来分析数据库性能并自动调整配置以提高效率。这两个工具都旨在减少数据库管理员手动优化配置的负担,同时提升数据库的性能和资源利用率。
两者背后的模型都是基于组合模型,Ottertune 应该很大基于贝叶斯,Akamas 主要基于递归神经网络。
Ottertune 针对云数据库也有支持,比如笔者正在用的 AWS 的 Aurora。Akama 则是不仅针对数据库参数调优,也对于底层操作系统,虚拟机等等参数也有调优。这两个工具,经过笔者使用,感觉主要针对的是想自己搭建数据库的厂商。云数据库都在减少需要调参的参数,底层系统参数更是一般无法调整,还有目前大部分云数据库都在做存算分离,大大减少了水平扩容的难度以及成本,需要调优的其实更少了。但是,不想用云自己搭建数据库的厂商还是很多的,请个专业的 DBA,可能无法做到随着业务量改变针对当前业务量最优的参数,在这一点 AI 工具可以轻易做到。
展开
hashcon于2024-02-03 20:01发布的图片
hashcon于2024-02-03 20:01发布的图片
评论
下一页
个人成就
2021年度人气作者No.60
优秀创作者
文章被点赞 2,992
文章被阅读 1,519,942
掘力值 28,023
收藏集
0
关注标签
21
加入于