LLMs & Embedding Modelle
Large Language Modelle und Embeddings
Wir stellen eine OpenAI-kompatible Modelloberfläche bereit. Auf dieser Seite stehen bewusst nur die Informationen, die Nutzer direkt brauchen: der Model-Parameter für den Client, das tatsächlich dahinterliegende Zielmodell, der Host-Typ myLab THL | GWDG und die wichtigsten Limits.
Setze im OpenAI-Client die base_url auf den Modell-Proxy https://models.mylab.th-luebeck.de/v1 und verwende einen Dummy-API-Key.
HinweilsHinweis GWDG-Rate-Limits >>>>>>>>>>>>>>>>>>TODO
Chat generische Aliasse
| Modellparameter |
Zielmodell |
myLab THL | GWDG |
API |
Hinweise |
chat-small |
qwen3-vl-8b |
THL |
chat/completions |
40.960 Kontext, max. 2 Bilder |
chat-default |
gpt-oss-120b |
GWDG |
chat/completions, completions |
Standardalias; beide Chat-Endpunkte vorhanden |
chat-medium |
gpt-oss-120b |
GWDG |
chat/completions, completions |
Gleiche Backend-Zuordnung wie chat-default |
chat-large |
glm-4.7 |
GWDG |
chat/completions |
Größerer Chat-Alias |
chat-xlarge |
mistral-large-3-675b-instruct-2512 |
GWDG |
chat/completions |
Größter Chat-Alias in der GWDG-Gruppe |
Chat-VL generische Aliasse
| Modellparameter |
Zielmodell |
myLab THL | GWDG |
API |
Hinweise |
chat-vl-small |
qwen3-vl-8b |
THL |
chat/completions |
40.960 Kontext, max. 2 Bilder |
chat-medium |
gemma4-31b |
GWDG |
chat/completions, completions |
Gleiche Backend-Zuordnung wie chat-default |
chat-vl-large |
qwen3.5-397b-a17b |
GWDG |
chat/completions |
Extern gehostet; Limits im Repo nicht dokumentiert |
chat-vl-xlarge |
mistral-large-3-675b-instruct-2512 |
GWDG |
chat/completions |
Extern gehostet; Limits im Repo nicht dokumentiert |
Andere generische Aliasse
| Modellparameter |
Zielmodell |
myLab THL | GWDG |
API |
Hinweise |
coder-small |
qwen3.6-27b |
THL |
chat/completions |
131.072 Kontext, max. 4 Bilder |
coder-large |
glm-4.7 |
GWDG |
chat/completions |
Extern gehostet |
Explizite Modellnamen
| Modellname |
myLab THL | GWDG |
API |
Hinweise |
gpt-oss-120b |
GWDG |
chat/completions, completions |
Direktname; Kontext im Repo nicht explizit dokumentiert |
glm-4.7 |
GWDG |
chat/completions |
Direktname; extern gehostet |
qwen3.5-397b-a17b |
GWDG |
chat/completions |
Direktname; extern gehostet |
mistral-large-3-675b-instruct-2512 |
GWDG |
chat/completions |
Direktname; extern gehostet |
qwen3-vl-8b |
THL |
chat/completions |
40.960 Kontext, max. 2 Bilder |
gemma4-31b |
THL |
chat/completions |
131.072 Kontext, max. 4 Bilder |
gemma4-e2b |
THL |
chat/completions |
131.072 Kontext, max. 4 Bilder |
qwen3.6-27b |
THL |
chat/completions |
131.072 Kontext, max. 4 Bilder |
Embeddings
| Modellparameter |
Zielmodell |
myLab THL | GWDG |
API |
Hinweise |
qwen3-embedding-4b |
qwen3-embedding-4b |
THL |
embeddings |
TEI-kompatibel; max-batch-tokens=65536, max-client-batch-size=64 |
Die Embedding-Modelle können mit der OpenAI-Bibliothek genutzt werden. Wichtig ist auch hier nur der Modell-Parameter; die Proxy-URL bleibt in dieser Wiki-Seite bewusst verborgen.
from openai import OpenAI
client = OpenAI(
base_url="<Modell-Proxy>/v1",
api_key="ignored",
)
result = client.embeddings.create(
model="qwen3-embedding-4b",
input="Beispieltext",
)
Kurzhinweise
chat-default und chat-medium zeigen auf dasselbe Zielmodell.
chat-small ist unser Chat-VL-Alias für das kleinere Vision-Modell.
- Nicht-LLM-Modelle wie OCR, Audio und Bildmodelle stehen auf der Seite
Andere Modelle (Image Audio etc).md.