Qwen(千问)系列大模型的tokenizer为什么是乱码?

Qwen系列大模型的tokenizer的vocabulary(词典)看起来有点奇怪似乎全是乱码?这是因为它对原始Unicode做了一些变换。

2024-10-06 · 2 分钟 · 805 字 · 寒寒

sparkastML 意图识别模型技术总结

我花了三天时间,升级了 sparkast 的意图识别模型,并建立了 sparkastML 这个开源深度学习实验室仓库,在未来给我们的产品提供更好的搜索增强功能。

2024-09-01 · 2 分钟 · 880 字 · 寒寒

我决定放弃 Vue 了

在约八个月的探索后,我决定正式放弃当前被WonderDays所使用的Vue。

2024-08-24 · 2 分钟 · 538 字 · 寒寒

关于npm中滥用行为和批量垃圾包的详细报告

本报告详细介绍了npm社区中普遍存在的恶意活动和垃圾包的滥用情况。

2024-08-14 · 3 分钟 · 1336 字 · 寒寒

如何在React种检测系统是否开启暗黑模式

在现代Web开发中,暗黑模式不仅能够减少眼睛的疲劳,还能在夜间提供更加舒适的阅读体验。那么,如何在React应用中优雅地检测用户是否启用了暗黑模式呢?

2024-08-13 · 2 分钟 · 544 字 · 寒寒

我们为什么需要自由和开源软件

什么是自由软件与开源软件?它们为我们今天的生活做出了哪些贡献?我们为什么应该支持它们?

2024-07-18 · 6 分钟 · 2842 字 · 寒寒

使用倍增法实现LCA(最近公共祖先)查询

暑假来临,寒寒参加OI集训,今日学到了如何使用倍增法查找一颗树的LCA(最近公共祖先),故在此分享。

2024-07-15 · 2 分钟 · 859 字 · 寒寒

OSI 模型

OSI 七层模型的学习笔记

2024-04-09 · 4 分钟 · 1696 字 · 寒寒

写在星火主页上线两周年

“星火主页”项目上线两周年,我的想法与感悟……

2024-03-05 · 3 分钟 · 1218 字 · 寒寒

macOS 刷新 DNS 缓存

sudo dscacheutil -flushcache; sudo killall -HUP mDNSResponder

2024-02-23 · 1 分钟 · 165 字 · 寒寒