风控与数据科学中心实习生 at 江苏泰融数智科技有限公司 (2026-03 – 2026-06)
- 模型开发与特征工程:深度参与和国内某汽车金融公司的合作项目,基于公司已有三方数据源,构建用户年龄、性别、婚姻状况等多维基础特征,完成 WOE 分箱与 IV 筛选,利用逻辑回归构建评分卡,KS 达 0.35、AUC 为 0.72。
- 策略工程化与业务落地:基于构建好的五类评分卡,理解评分卡模型中的伪代码,并转化为业务端易于理解的加工逻辑,制作 Excel 文件,汇总数据源等信息;完成决策引擎配置,确保专家经验与建模结果在自动化信贷审批场景中的精准落地。
金融工程组实习生 at 东吴证券股份有限公司研究所 (2025-12 – 2026-02)
- LLM 驱动的因子进化研究:利用 DeepSeek 等大语言模型驱动因子改进与情绪 Alpha 挖掘;通过多轮 Prompt 优化,使波动率因子 RankIC 从 4.03%提升至 7.80%,ICIR 从 0.31 提升至 0.79,验证了 LLM 在复杂逻辑优化中的卓越性能。
- 因子研究回测与 Pipeline 搭建:独立整合 A 股长周期数据,搭建自动化研究与回测框架,支持 Parquet 缓存、数据清洗(去极值/中性化/标准化)及多维度绩效评估(年化/夏普/回撤),确保了实验的高效迭代。
量化研究员实习生 at 宁波灵均投资管理合伙企业 (2025-06 – 2025-09)
- 大规模特征工程与评估:利用 Python 自动化处理 5000+只标的的海量历史数据,构建含 500+维度的特征库(涵盖价值、增长、动量等维度),通过相关性分析与共线性筛选,沉淀出 100+个高价值核心特征,实现平均日频 IC 超过 0.04。
- 集成学习建模与调优:构建基于 LightGBM、XGBoost 及岭回归的集成预测模型,采用 720 日滚动窗口策略与 GridSearch 自动调参,针对非平稳数据进行风险平滑处理,在跨周期回测中实现年化收益率约 30%,夏普比率 2.826。
数据分析实习生 at 北京鹰瞳科技发展股份有限公司 (2024-08 – 2024-10)
- 数据提取与清洗:基于 50000+份临床记录、诊断及视网膜影像数据,通过 SQL 提取数据,使用 Python 对数据进行清洗,使用 MAD 方法处理异常值,对重复值去重,并对数据进行 Z-score 标准化处理,最终交付高质量数据集,用于后续分析研究。
- 统计分析与可视化:利用 Minitab/SPSS 进行统计分析与假设验证,以支撑研究及 AI 产品的开发;学习并尝试应用回归、聚类及特征工程开发预测模型,提升诊断准确率;通过 Tableau 生成数据可视化看板,为临床及产品团队提供洞察支持。