8 11 2

Zhenting Wang

ztwang

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

PromptBridge: Cross-Model Prompt Transfer for Large Language Models

commented on a paper about 1 month ago

PromptBridge: Cross-Model Prompt Transfer for Large Language Models

upvoted a paper about 1 month ago

M3-Bench: Multi-Modal, Multi-Hop, Multi-Threaded Tool-Using MLLM Agent Benchmark

View all activity

Organizations

upvoted a paper about 1 month ago

PromptBridge: Cross-Model Prompt Transfer for Large Language Models

Paper • 2512.01420 • Published Dec 1, 2025 • 9

commented a paper about 1 month ago

PromptBridge: Cross-Model Prompt Transfer for Large Language Models

Paper • 2512.01420 • Published Dec 1, 2025 • 9 •

upvoted a paper about 1 month ago

M3-Bench: Multi-Modal, Multi-Hop, Multi-Threaded Tool-Using MLLM Agent Benchmark

Paper • 2511.17729 • Published Nov 21, 2025 • 16

commented a paper about 1 month ago

M3-Bench: Multi-Modal, Multi-Hop, Multi-Threaded Tool-Using MLLM Agent Benchmark

Paper • 2511.17729 • Published Nov 21, 2025 • 16 •

upvoted 2 papers 3 months ago

R-WoM: Retrieval-augmented World Model For Computer-use Agents

Paper • 2510.11892 • Published Oct 13, 2025 • 21

Vision-Zero: Scalable VLM Self-Improvement via Strategic Gamified Self-Play

Paper • 2509.25541 • Published Sep 29, 2025 • 140

authored a paper 3 months ago

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning

Paper • 2509.22576 • Published Sep 26, 2025 • 134

commented a paper 3 months ago

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning

Paper • 2509.22576 • Published Sep 26, 2025 • 134 •

upvoted a paper 3 months ago

EPO: Entropy-regularized Policy Optimization for LLM Agents Reinforcement Learning

Paper • 2509.22576 • Published Sep 26, 2025 • 134

updated a Space 4 months ago

MCP-Bench Leaderboard

🏆

Leaderboard for MCP-Bench

liked a Space 4 months ago

MCP-Bench Leaderboard

🏆

Leaderboard for MCP-Bench

published a Space 4 months ago

MCP-Bench Leaderboard

🏆

Leaderboard for MCP-Bench

authored a paper 4 months ago

MCP-Bench: Benchmarking Tool-Using LLM Agents with Complex Real-World Tasks via MCP Servers

Paper • 2508.20453 • Published Aug 28, 2025 • 63

commented a paper 4 months ago

MCP-Bench: Benchmarking Tool-Using LLM Agents with Complex Real-World Tasks via MCP Servers

Paper • 2508.20453 • Published Aug 28, 2025 • 63 •

upvoted a paper 4 months ago

MCP-Bench: Benchmarking Tool-Using LLM Agents with Complex Real-World Tasks via MCP Servers

Paper • 2508.20453 • Published Aug 28, 2025 • 63

commented a paper 4 months ago

MCP-Bench: Benchmarking Tool-Using LLM Agents with Complex Real-World Tasks via MCP Servers

Paper • 2508.20453 • Published Aug 28, 2025 • 63 •

updated 2 models 7 months ago

ztwang/Qwen2.5-Coder-7B_combined_logic_longseq_combinedcodecontests_nocl_global_step_100

8B • Updated May 26, 2025 • 2

ztwang/Qwen2.5-Coder-7B_combined_logic_longseq_combinedcodecontests_cl_global_step_100

8B • Updated May 25, 2025 • 3

updated 2 models 8 months ago

ztwang/Qwen2.5-Coder-7B_combined_logic_longseq_combinedcodecontests_nocl_global_step_50

8B • Updated May 24, 2025 • 4

ztwang/Qwen2.5-Coder-7B_combined_logic_longseq_combinedcodecontests_cl_global_step_50

8B • Updated May 24, 2025 • 6

Zhenting Wang

AI & ML interests

Recent Activity

Organizations

ztwang's activity

MCP-Bench Leaderboard

MCP-Bench Leaderboard

MCP-Bench Leaderboard