cv
My CV.
Basics
| Name | 桂之瑜 |
| Label | 本科生 |
| [email protected] | |
| Phone | 18005859962 |
| Url | 00ffcc.tech |
| Summary | 中国科学技术大学 少年班学院 华夏计算机科技英才班 大三在读,GPA:3.85/4.3,排名:22/219。国家级大创负责人(编号:202410358067S) |
Education
-
2022.09 - 2026.06 安徽,合肥
Awards
- 2023.11
- 2023.9
- 2025.1
Projects
- 2025.03 - 2025.03
Count-R1
在数数任务上复现了Deepseek-R1 ZERO
- 通过强化学习(不使用冷启动)将Qwen2.5-3B的正确率提高了40%,观察到了自发的思维链
- 证实了强化学习需要强大的基模,在小模型上蒸馏优于强化学习
- 2024.02 - 2025.02
切题输入法(AttnInput)
使用大语言模型增强拼音输入法,负责全部后端模型推理与训练工作,已获得奇绩创投口头投资承诺
- 在首字母简拼上达到SOTA性能
- 大幅提高数据利用率,减少训练所需资源
- 基于RWKV线性大语言模型,支持无限长度上下文
- 2025.01 - 2025.02
conRWKV
首个支持continuous-batching和chunk prefill的高并发RWKV后端推理框架
- 使用flash-linear-attention技术,提高了并行度,并且可以利用tensorcore,大幅提高推理速度
- 支持continuous-batching,确保高吞吐量
- 提供了兼容OpenAI格式的api接口
Publications
-
2025.02.16 AttnInput: Advancing Context-Aware Pinyin Input with Efficient Language Model Integration
投稿中
使用大语言模型增强拼音输入法,在首字母简拼上达到SOTA性能,同时大幅降低了训练成本。
Skills
| 后端开发 | |
| Python | |
| C | |
| Cpp | |
| Cython | |
| SQL |
| 前端开发 | |
| PyQt |
| GPU Kernel开发 | |
| Triton | |
| CUDA | |
| HIP |
| 硬件开发 | |
| Verilog | |
| 嘉立创EDA | |
| 会搭服务器 |
| Libraries | |
| PyTorch | |
| Transformers | |
| vLLM | |
| FastAPI |
Interests
| LLM | |
| LLM Reasoning | |
| LLM 推理优化 | |
| 线性 LLM 结构设计 | |
| LLM 可解释性 |
| 具身智能 | |
| 灵巧手 | |
| 视触觉传感器 |
| 自动驾驶 | |
| 内河航运自动驾驶、辅助驾驶 |
Certificates
| 鲲鹏昇腾特训营结营证书 | ||
| 华为计算产品线总裁 张熙伟 | 2024-07-12 |
Work
-
2025.01 - 2025.02