Hack. Build. Scale.

你好,我是 Yicheng

Engineer,现专注构建自动驾驶 VLA 模型的底层基座。热衷于探索各种新技术与旧轮子,用极致的工程优化驱动训练、推理。

Projects

自动驾驶训练数据存储

Architect

基于 Apache Iceberg 构建,解决海量非结构化训练数据的版本控制和一致性问题。优化了数据治理流程,支持了多模态数据的存储和检索,降低了数据存储成本的同时支撑集群的训练加速。

Iceberg Data Lake

大规模视频分析推理服务

Lead Engineer

利用 Ray + PyTorch/vLLM 实现几十万小时视频的自动标注。采用 C++/Python 混合编程构建共享内存加速方案,极大提升了分布式推理吞吐量。

Ray Shared Memory Distributed Inference VLM

Posts

Memos:碎片化知识的自托管港湾

在这个信息过载的时代,我们每天都会产生大量的碎片化想法:一段代码灵感、一句看到的金句、或者仅仅是“买瓶酱油”这样的琐事。Memos 就是这样一个为了捕捉这些瞬间而生的工具。

AutoGPT 初体验:由于太烧钱而被迫终止

这两天 GitHub 上最火的项目莫过于 AutoGPT 了。在这个 LLM 狂飙的五月,大家都在谈论 Agent 的未来。

ChatGPT 与大模型时代的到来

记得上一次对AI感到震撼还是AlphaGo击败李世石的时候。那时候觉得AI虽然厉害,但离“通用智能”还很远。没想到几年过去,ChatGPT横空出世,彻底改变了这种认知。 为什么这次不一样 之前的“智能助手”(Siri, Alexa等)...

如何提高自制力

如何提高自制力(知乎高赞回答,credits to @edmond) 以下内容均搬运自知乎,添加一些NotebookLM产生的贴图

Lab

Self-hosted 小集群
Immich, Trilium, Dify/Clawbot
DIY
从虚拟世界往物理世界延伸,捣鼓木工,智能家居
Life
带娃,做饭,滑雪

Tech Stack

Languages
C++, Python, Java, SQL, Go, Rust, ...
AI & Compute
Ray, PyTorch, LoRA, TensorRT
Data & Storage
Iceberg, DuckDB, LanceDB, PyArrow, Spark, Flink, ...
Ops & Infrastructure
Docker, K8s, PVE