Nexus-Agents Research Index

Generated: 2026-03-18 (ET) Total Papers: 176 | Techniques: 43 | Topics: 12

Quick Stats

Status	Papers	Techniques
Implemented	-	42
In Progress	-	0
Planned	-	0
Not Started	-	0
Rejected	-	1

Note: Paper-level status tracking deprecated. Technique status is source of truth.

Topics

Topic	Papers	Techniques	Description
Consensus	10	6	Multi-agent decision protocols and voting
Routing	19	8	Cost-efficient model routing and selection
Memory	23	9	Context, long-term memory, and compression
Code Generation	21	6	Code generation, repair, and self-improvement
CLI Tools	0	0	External CLI integration and protocols
Orchestration	27	12	Multi-agent coordination and workflows
Security	2	2	Security analysis, prompt injection defense
Evaluation	0	0	Benchmarks, metrics, and testing methodologies (planned)
Safety	0	0	AI safety, alignment, and reward hacking (planned)
Planning	0	0	Task planning, decomposition, and reasoning chains (planned)
Tool Use	0	0	Tool augmentation, function calling, and MCP (planned)
Reasoning	0	0	Reasoning, self-reflection, and search strategies (planned)

Priority 1 (P1) Techniques

These techniques are high-impact and align well with the current architecture.

Technique	Topic	Key Metrics	Issue
Aegean Consensus Protocol	consensus	latency_reduction: 1.2x-20x, token_reduction: 4.4x, quality_impact: within 2.5% of baseline	#119
Task-Type Protocol Selection	consensus	reasoning_improvement: +13.2%, knowledge_improvement: +2.8%	#125
Multi-Agent Reflexion (MAR)	consensus	reasoning_improvement: significant across benchmarks	-
IPR Quality-Constrained Routing	routing	cost_reduction: 43.9%, latency: sub-150ms	#128
A-MEM Agentic Memory	memory	semantic_organization: Automatic attribute extraction and linking, evolution_detection: Refinement, extension, supersession detection	#122
TRINITY Thinker/Worker/Verifier Roles	orchestration	benchmark_accuracy: 86.2% on LiveCodeBench	#141
Self-Refine Iterative Loop	code-generation	average_improvement: 20%	#126
Reflexion Verbal Reinforcement Learning	code-generation	alfworld_improvement: +22%, hotpotqa_improvement: +20%, humaneval_pass1: 91%	#130
STPA MCP Framework	security	hazard_coverage: Systematic UCA identification, safety_constraints: Auto-generated from analysis	#328
AFlow MCTS Workflow Generation	orchestration	workflow_quality: Improved through search optimization	#329
SEW Self-Evolving Workflows	orchestration	improvement_rate: Continuous through execution feedback	#330
ZeroRouter Universal Difficulty Space	routing	routing_accuracy: Cross-domain difficulty assessment	#338
Context Rot Prevention	memory	-	#1574
Wave-Based Parallel Execution	orchestration	-	-

Priority 2 (P2) Techniques

Medium-impact or requiring moderate changes.

Technique	Topic	Key Metrics	Issue
CP-WBFT Byzantine Fault Tolerant Consensus	consensus	fault_tolerance: 85.7%	#103
Free-MAD Anti-Conformity Scoring	consensus	robustness: enhanced against attacks	#152
TOPSIS Multi-Criteria Routing	routing	cost_reduction: 31.46%	#146
PILOT Budget-Constrained Routing	routing	adaptive: handles diverse budget requirements	#102
SATER Confidence-Aware Routing	routing	cost_reduction: 50%+, latency_reduction: 80%+ cascade	#99
Agreement-Based Cascading (ABC)	routing	cost_optimization: significant	#121
Preference-Trained Router (RouteLLM)	routing	cost_reduction: 2x	#148
Mem0 Scalable Long-Term Memory	memory	latency_reduction: 91% lower p95, token_savings: 90%, quality_improvement: 26%	#156
MIRIX Six-Type Memory System	memory	accuracy_vs_rag: +35%, storage_reduction: 99.9%, benchmark_accuracy: 85.4%	#157
MobiMem Post-Deployment Evolution	memory	profile_alignment: 83.1%, retrieval_speed: 280x faster than GraphRAG, task_success_improvement: 50.3%	#149
Adaptive Memory	memory	performance_improvement: Configurable priority scoring	#143
Evolving Orchestration Upgrade	orchestration	task_completion_improvement: 15-30%	#335
LATTS Adaptive Test-Time Compute	orchestration	performance_parity: 1B model matches 405B	#153
Voyager Skill Library Pattern	code-generation	discovery_improvement: 3.3x more unique items, speed_improvement: up to 15.3x faster milestone	#150
SICA Self-Improving Agent	code-generation	swebench_improvement: 17% -> 53%, file_editing_improvement: 82% -> 94%	#151
Constitutional AI Self-Critique	code-generation	scales: without human labelers	#147
Higher-Order Voting (OW/ISP)	consensus	correlation_handling: Improved consensus on correlated inputs	#333
Forest-of-Thought Multi-Tree Reasoning	orchestration	reasoning_quality: Improved through diverse exploration, efficiency: Sparse activation reduces compute	#331
Agent-SafetyBench Evaluation Suite	security	coverage: Multi-dimensional safety evaluation	#332
DAAO VAE Difficulty Estimation	routing	routing_accuracy: Improved task-model alignment	#334
Hindsight Belief Memory	memory	reasoning_quality: Improved through belief tracking	#336
Scaling Agent Coordination Predictor	orchestration	allocation_efficiency: Improved agent utilization	#337
Failure Lesson Injection	orchestration	-	#1568
Skill Relevance Matching	orchestration	-	#1569
Write-Time Memory Deduplication	memory	-	#1570

Recently Reviewed Papers

Date	Paper	Topic	Priority
2026-03-09	Red-Teaming LLM Multi-Agent Systems via Communication Attacks	inter-agent-security	-
2026-03-09	MASFactory: A Graph-centric Framework for Orchestrating LLM-Based Multi-Agent Systems with Vibe Graphing	graph-orchestration	-
2026-03-04	Style Over Substance: Evaluation Biases for Large Language Models	-	-
2026-03-04	FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance	routing	-
2026-03-04	CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Society	orchestration	-

Papers by Topic

Security (2 papers)

STPA MCP Framework: System-Theoretic Process Analysis for MCP Safety - Formal STPA safety analysis methodology for MCP tools. Systematically
Agent-SafetyBench: Comprehensive Safety Evaluation for AI Agents - Comprehensive safety evaluation suite for agent behaviors across multiple

GitHub Issues

Issue	Feature	Related Papers
#119	Aegean Consensus Protocol	arxiv-2512.20184
#125	Task-Type Protocol Selection	arxiv-2502.19130
#103	CP-WBFT Byzantine Fault Tolerant Consensus	arxiv-2511.10400
#152	Free-MAD Anti-Conformity Scoring	arxiv-2509.11035
#146	TOPSIS Multi-Criteria Routing	arxiv-2509.07571
#128	IPR Quality-Constrained Routing	arxiv-2509.06274, arxiv-2406.18510
#102	PILOT Budget-Constrained Routing	arxiv-2508.21141
#99	SATER Confidence-Aware Routing	arxiv-2510.05164
#121	Agreement-Based Cascading (ABC)	arxiv-2410.10347
#148	Preference-Trained Router (RouteLLM)	arxiv-2406.18665
#156	Mem0 Scalable Long-Term Memory	arxiv-2504.19413
#157	MIRIX Six-Type Memory System	arxiv-2507.07957
#149	MobiMem Post-Deployment Evolution	arxiv-2512.15784
#142	Graph-Based Memory	arxiv-2504.19413
#143	Adaptive Memory	arxiv-2310.08560
#122	A-MEM Agentic Memory	arxiv-2502.12110
#141	TRINITY Thinker/Worker/Verifier Roles	arxiv-2512.04695
#154	RL-Trained Orchestrator	arxiv-2505.19591
#335	Evolving Orchestration Upgrade	arxiv-2505.19591
#153	LATTS Adaptive Test-Time Compute	arxiv-2509.20368
#126	Self-Refine Iterative Loop	arxiv-2303.17651
#130	Reflexion Verbal Reinforcement Learning	arxiv-2303.11366
#150	Voyager Skill Library Pattern	arxiv-2305.16291
#151	SICA Self-Improving Agent	arxiv-2504.15228
#147	Constitutional AI Self-Critique	arxiv-2212.08073
#131	Self-Debug Code Repair	arxiv-2304.05128
#328	STPA MCP Framework	arxiv-2601.08012
#329	AFlow MCTS Workflow Generation	arxiv-2410.10762
#330	SEW Self-Evolving Workflows	arxiv-2505.18646
#333	Higher-Order Voting (OW/ISP)	arxiv-2510.01499
#331	Forest-of-Thought Multi-Tree Reasoning	arxiv-2412.09078
#332	Agent-SafetyBench Evaluation Suite	arxiv-2412.14470
#334	DAAO VAE Difficulty Estimation	arxiv-2509.11079
#336	Hindsight Belief Memory	arxiv-2512.12818
#337	Scaling Agent Coordination Predictor	arxiv-2512.08296
#338	ZeroRouter Universal Difficulty Space	zerorouter-tbd
#1568	Failure Lesson Injection
#1569	Skill Relevance Matching
#1574	Context Rot Prevention
#1570	Write-Time Memory Deduplication	arxiv-2601.02553

Search Tags

#adaptive #agent-specialization #agentic-memory #agreement #anti-conformity #attribute-extraction #automatic-discovery #bayesian #belief-state #benchmarking #budget-constraint #byzantine #cascade #code-repair #comprehensive #confidence-aware #constitutional #context-injection #context-management #contextual-bandit #coordination #coordinator #correlation-aware #cost-optimization #cross-critique #debate #deduplication #difficulty-estimation #dynamic #dynamic-linking #dynamic-selection #embedding #ensemble #episodic-memory #evolution #evolutionary #executable #execution-feedback #failure-recovery #fault-tolerance #feedback-learning #formal-safety #formal-verification #graph #hazard-analysis #hindsight #inter-agent #iterative #latent-space #lifelong-learning #lightweight #linucb #long-term #mcp #mcts #memory-efficiency #memory-evolution #multi-criteria #multi-tree #multimodal #observability #optimal-weighting #parallel-execution #pareto #policy #post-deployment #prediction #preference-data #principles #priority #production #protocol-selection #pruning #puppeteer #quality-constrained #quorum #reasoning #recency-decay #reflection #reflexion #reinforcement-learning #relational #relevance #risk-assessment #role-based #routing #rubber-duck #safety-evaluation #scalable #scaling #scoring #self-critique #self-debug #self-evolving #self-feedback #self-improvement #semantic #semantic-similarity #shortest-response #skill-library #sparse-activation #stpa #streaming #structured-memory #task-classification #task-routing #test-time #three-module #token-efficiency #tolerance #training-free #transfer-learning #universal-difficulty #vae #verbal-rl #verifier #versioning #wave-coordination #weighted #worker-dispatch #workflow-generation #workflow-optimization #zettelkasten

Registry Files

papers.yaml - All 176 papers with metadata
techniques.yaml - All 43 techniques with status
sources.yaml - Product docs and other sources

How to Contribute

See CONTRIBUTING.md for guidelines on adding new research.

Generated from YAML registries. Last updated: 2026-03-18 (ET)