About Me

教育


个人维护项目

搭建了一套完整的量化交易方案,目前正在稳定运行当中。

  1. binance websocket数据不间断获取
  2. 数据库的搭建 PostgreSQL
  3. 因子生成
  4. 交易评估

工作经历


StorageX.ai 无锡 软件开发 | 2022/05 – Now
基于FPGA的llm(including llama, deepseek)系列模型全生态实现 (Python, Gradio, Pybind, RAG, Triton, CUDA)

基于公司硬件实现的llm模型的算子,在硬件平台上跑llama系列模型,将硬件暴露出来的接口用python进行绑定,从而实现与gradio可视化进行结合,形成一套完整的llm应用。

Soc相关研究以及开发(LLVM、spike)

AI编译器 相关技术栈(MLIR,LLVM,TVM,CMake,Ninja,gRPC等)
将深度学习模型如tensorflow或pytorch通过MLIR转为高阶IR,并对IR进行分析pass编写,优化,去除dead code等操作,转成精简的MLIR并进一步下沉到llvm IR,并通过xilinx的工具进一步交叉编译为AIE的可执行文件,整个项目属于开创性的工作,首次打通了模型到FPGA的运行流程,缺点是严重依赖xilinx的Compiler的支持。

腾讯 深圳 AI Lab T7 应用研究岗 | 2020/06 – 2022/05
任务:从序列出发研究蛋白质结构。蛋白质折叠问题是生物里面核心问题,蛋白质结构决定了该蛋白质的功能,而蛋白质序列决定了蛋白质的结构。因此如何从蛋白质序列出发得到蛋白质的结构是生物信息中重要探索方向。针对大量的蛋白质序列,如何将自然语言处理技术应用在蛋白质序列上是一个重要的研究方向。

任务: 抗体项目的孵化以及上线 抗体是蛋白质的一个细分的种类,抗体的重要性不言而喻。而国内在抗体这方面进展不是很大主要因为抗体序列简单,但是 CDR3 结构折叠难,同时抗体相关的数据集比较少,如何将大量的无监督抗体序列应用起来成为生物信息的一个研究重点。

无锡希捷科技 算法岗 | 2018/06 – 2018/12
任务: 通过LightGBM来检测硬盘的损坏程度

开源项目


获奖情况


Paper & 专利


Technologies

🤖 Machine Learning

Transformers, PyTorch, Scikit-Learn, Langchain, TensorRT, Triton, ONNX.


☁️ Cloud

AWS, GCP, Azure, Docker, Github Actions.


🏗️ Non-ML

Rust, Go, Python, C++