Cohere Rerank API für den RAG-Produktivbetrieb
Steigern Sie die RAG-Genauigkeit um 40% mit der Cohere Rerank API: Einfache Integration, mehrsprachiger Support, produktionsbereit.
Warum Cohere Rerank ?
- ✅ Bis zu 40% Genauigkeitsverbesserung gegenüber Bi-Encodern
- ✅ Unterstützt mehr als 100 Sprachen
- ✅ Gehostete API (kein Modell-Hosting)
- ✅ Schnell (< 200ms für 100 Dokumente)
Schnellstart
DEVELOPERpythonimport cohere co = cohere.Client('YOUR_API_KEY') def rerank_with_cohere(query, documents): results = co.rerank( model='rerank-english-v3.0', # oder 'rerank-multilingual-v3.0' query=query, documents=documents, top_n=10 ) return [doc['text'] for doc in results.results] # Verwendung retrieved_docs = vector_search(query, k=100) reranked = rerank_with_cohere(query, retrieved_docs)
Modelle (November 2025)
rerank-english-v3.0
- Nur Englisch
- 1$ pro 1000 Abfragen
- Beste Genauigkeit
rerank-multilingual-v3.0
- Mehr als 100 Sprachen
- 1$ pro 1000 Abfragen
- Hervorragend für globale Anwendungen
Mit Metadaten
DEVELOPERpythonresults = co.rerank( query=query, documents=[ {"text": doc, "metadata": {"source": "wiki", "date": "2025"}} for doc in documents ], top_n=10, return_documents=True ) for r in results.results: print(f"Score: {r.relevance_score}") print(f"Text: {r.document['text']}") print(f"Metadata: {r.document['metadata']}")
Kostenoptimierung
DEVELOPERpython# Nur reranken, wenn der initiale Score niedrig ist def smart_rerank(query, initial_results, threshold=0.7): # Wenn das erste Ergebnis hohe Vertrauenswürdigkeit hat, Reranking überspringen if initial_results[0]['score'] > threshold: return initial_results[:10] # Andernfalls reranken return rerank_with_cohere(query, [r['text'] for r in initial_results])
Cohere Rerank ist der einfachste Weg, die RAG-Genauigkeit erheblich zu verbessern. Integrieren Sie es einfach nach dem Retrieval.
Tags
Verwandte Artikel
Reranking RAG : +40% Genauigkeit mit Cross-Encoders (Leitfaden 2025)
+40% RAG-Genauigkeit dank Reranking. Umfassender Leitfaden zu Cross-Encoders, der API Cohere Rerank und ColBERT für Ihre Retrieval-Systeme in Produktion.
LLM Reranking: LLMs nutzen, um Ihre Ergebnisse neu anzuordnen
LLMs können beim Reranking von Suchergebnissen helfen, indem sie den Kontext tiefgehend verstehen. Erfahren Sie, wann und wie Sie diese kostspielige, aber leistungsstarke Technik einsetzen.
Cross-Encoder-Re-Ranking für höhere RAG-Genauigkeit
Erreichen Sie über 95 % Präzision: Verwenden Sie Cross-Encoder, um abgerufene Dokumente neu zu bewerten und False Positives zu eliminieren.