<?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:news="http://www.google.com/schemas/sitemap-news/0.9" xmlns:xhtml="http://www.w3.org/1999/xhtml" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"><url><loc>https://epoch.ai/benchmarks</loc></url><url><loc>https://epoch.ai/benchmarks/about</loc></url><url><loc>https://epoch.ai/benchmarks/adversarial-nli</loc></url><url><loc>https://epoch.ai/benchmarks/aider-polyglot</loc></url><url><loc>https://epoch.ai/benchmarks/apex-agents</loc></url><url><loc>https://epoch.ai/benchmarks/arc-agi</loc></url><url><loc>https://epoch.ai/benchmarks/arc-agi-2</loc></url><url><loc>https://epoch.ai/benchmarks/arc-ai2</loc></url><url><loc>https://epoch.ai/benchmarks/balrog</loc></url><url><loc>https://epoch.ai/benchmarks/bbh</loc></url><url><loc>https://epoch.ai/benchmarks/bool-q</loc></url><url><loc>https://epoch.ai/benchmarks/cad-eval</loc></url><url><loc>https://epoch.ai/benchmarks/chess-puzzles</loc></url><url><loc>https://epoch.ai/benchmarks/common-sense-qa-2</loc></url><url><loc>https://epoch.ai/benchmarks/cybench</loc></url><url><loc>https://epoch.ai/benchmarks/deepresearchbench</loc></url><url><loc>https://epoch.ai/benchmarks/eci</loc></url><url><loc>https://epoch.ai/benchmarks/fictionlivebench</loc></url><url><loc>https://epoch.ai/benchmarks/frontiermath-tier-4</loc></url><url><loc>https://epoch.ai/benchmarks/frontiermath-tiers-1-3</loc></url><url><loc>https://epoch.ai/benchmarks/gdpval</loc></url><url><loc>https://epoch.ai/benchmarks/geobench</loc></url><url><loc>https://epoch.ai/benchmarks/gpqa-diamond</loc></url><url><loc>https://epoch.ai/benchmarks/gsm8k</loc></url><url><loc>https://epoch.ai/benchmarks/gso</loc></url><url><loc>https://epoch.ai/benchmarks/hella-swag</loc></url><url><loc>https://epoch.ai/benchmarks/hle</loc></url><url><loc>https://epoch.ai/benchmarks/lambada</loc></url><url><loc>https://epoch.ai/benchmarks/lech-mazur-writing</loc></url><url><loc>https://epoch.ai/benchmarks/live-bench</loc></url><url><loc>https://epoch.ai/benchmarks/math-level-5</loc></url><url><loc>https://epoch.ai/benchmarks/metr-time-horizons</loc></url><url><loc>https://epoch.ai/benchmarks/mmlu</loc></url><url><loc>https://epoch.ai/benchmarks/open-book-qa</loc></url><url><loc>https://epoch.ai/benchmarks/os-world</loc></url><url><loc>https://epoch.ai/benchmarks/otis-mock-aime-2024-2025</loc></url><url><loc>https://epoch.ai/benchmarks/piqa</loc></url><url><loc>https://epoch.ai/benchmarks/post-train-bench</loc></url><url><loc>https://epoch.ai/benchmarks/science-qa</loc></url><url><loc>https://epoch.ai/benchmarks/search</loc></url><url><loc>https://epoch.ai/benchmarks/simple-qa-verified</loc></url><url><loc>https://epoch.ai/benchmarks/simplebench</loc></url><url><loc>https://epoch.ai/benchmarks/superglue</loc></url><url><loc>https://epoch.ai/benchmarks/swe-bench-verified</loc></url><url><loc>https://epoch.ai/benchmarks/terminal-bench</loc></url><url><loc>https://epoch.ai/benchmarks/the-agent-company</loc></url><url><loc>https://epoch.ai/benchmarks/trivia-qa</loc></url><url><loc>https://epoch.ai/benchmarks/use-this-data</loc></url><url><loc>https://epoch.ai/benchmarks/video-mme</loc></url><url><loc>https://epoch.ai/benchmarks/vpct</loc></url><url><loc>https://epoch.ai/benchmarks/webdev-arena</loc></url><url><loc>https://epoch.ai/benchmarks/weirdml</loc></url><url><loc>https://epoch.ai/benchmarks/wino-grande</loc></url></urlset>