Hailiang Huang

2 papers · Latest: May 1, 2026

FinSafetyBench: Evaluating LLM Safety in Real-World Financial Scenarios

FinSafetyBench is a new bilingual red-teaming benchmark evaluating LLM safety and compliance in real-world financial scenarios, revealing vulnerabilities.

2605.00706May 1, 2026

Software Engineering

Cascaded Code Editing: Large-Small Model Collaboration for Effective and Efficient Code Editing

This paper proposes Cascaded Code Editing, combining large models for edit sketch generation and small models for efficient application.

2604.19201Apr 21, 2026

📬 Weekly AI Paper Digest

Get the top 10 AI/ML arXiv papers from the week — summarized, scored, and delivered to your inbox every Monday.