Latest revision as of 15:14, 27 July 2026

Discover cloud and AI on infocepo.com

infocepo.com – Cloud, AI & Labs

Bienvenue sur le portail infocepo.com.

Ce wiki documente l’écosystème Cloud, IA, automatisation et lab d’Infocepo. Il s’adresse aux :

administrateurs systèmes,
ingénieurs cloud,
développeurs,
étudiants,
curieux qui veulent apprendre en pratiquant.

L’objectif est simple : transformer la théorie en scripts réutilisables, schémas, architectures, APIs et laboratoires concrets.

Accès rapide

Portail principal

infocepo.com

Assistant IA

Chat assistant

Liste des pages du wiki

Toutes les pages

Vue d’ensemble

Infra architecture overview

Démarrer rapidement

Parcours recommandés

1. Construire un assistant IA privé

Déployer une stack type Hermes WebUI + Ollama + GPU
Ajouter un modèle de chat et un modèle de résumé
Brancher des données internes via RAG + embeddings

2. Lancer un lab cloud

Créer un petit cluster Kubernetes, OpenStack ou bare-metal
Mettre en place un pipeline de déploiement (Helm, Ansible, Terraform…)
Ajouter un service IA : transcription, résumé, chatbot, OCR…

3. Préparer un audit ou une migration

Inventorier les serveurs avec ServerDiff.sh
Concevoir l’architecture cible
Automatiser la migration avec des scripts reproductibles

Vue d’ensemble du contenu

Guides IA & outils : assistants, modèles, évaluation, GPU, RAG
Cloud & infrastructure : Kubernetes, OpenStack, HA, HPC, DevSecOps
Labs & scripts : audit, migration, automatisation
Comparatifs : Kubernetes vs OpenStack vs AWS vs bare-metal, etc.

Vision

The world after automation

Le but à long terme est de construire un environnement où :

les assistants IA privés accélèrent la production,
les tâches répétitives sont automatisées,
les déploiements sont industrialisés,
l’infrastructure reste compréhensible, portable et réutilisable.

Chaque sortie IA est mesurée en temps réel, les modèles faibles sont remplacés automatiquement, et les tâches sans valeur sont coupées. L'autonomie vient de mécanismes techniques qui fonctionnent quand personne ne regarde — pas de règles écrites dans un doc.

Main page summary

Catalogue rapide des services

Services principaux
Catégorie	Service	Rôle
API	LLM	Modèles de chat, code, RAG, OCR
API	STT	Transcription audio
API	TTS	Synthèse vocale
API	realtime-ai	Temps réel WebSocket / WebRTC
API	IMAGE2TXT	OCR / VLM via endpoint dédié
API	summary	Résumé de textes longs
API	EMBEDDINGS	Embeddings pour RAG
API	ChromaDB	Base vecteur
API	TXT2IMAGE	Génération d’images
API	diarization	Segmentation locuteurs
Observabilité	monitoring	Dashboards techniques
Observabilité	status	Disponibilité des services
Observabilité	web-stat	Statistiques web
Observabilité	LLM-stat	Vue API / usage
Outils	dataLab	Environnement de travail hors-production
Outils	realtime translation	Traduction
Outils	Demos	Démonstrateurs

Nouveautés

Nouveautés 20/07/2026

Traduction temps réel : réduction significative des hallucinations lors des silences, diminution de la latence et ajout de la plupart des langues en TTS.
TTS Omnivoice : Qualité TTS augmenté et ajout plus global des langues (600).
LightRAG : LightRAG est un framework RAG avancé et léger qui combine graphes de connaissances et recherche vectorielle pour une analyse contextuelle profonde et efficace.
API reranker : git.
API embedding : Mise à jour des paramètres RAG optimisation : bge-m3 (chunk 800, 100 overlap). git
privacy-filter : filtrage données personnelles.
Un seul fichier CLAUDE.md inspiré d'Andrej Karpathy pour transformer Claude en un vrai ingénieur logiciel.
Qwen3.6 : Qwen3.6 delivers substantial upgrades in agentic coding and thinking preservation than previous Qwen models. Déployé avec NVIDIA/Qwen3.6-35B-A3B-NVFP4 — quantisation NVFP4 optimisée pour l'inférence GPU NVIDIA.
Hermes Agent : l'agent qui s'améliore et grandit avec toi.
opencode : CLI coder à comparer avec Aider / OpenHands. (⚠️ migration : ancienne URL `github.com/sst/opencode` → redirige vers `anomalyco/opencode`)
api-convert2md : extraction de tableaux pour RAG compatible Open WebUI.
Ajout de brains expérimentaux.
Ajout de legal-agent.
Ajout de ai-security.
langextract : démo extraction d'entités. (⚠️ nécessite authentification)
sam-audio : séparation audio sémantique.
Ajout de l'API Realtime : WebRTC / WebSocket bidirectionnel basse latence.

Priorités

Top tasks

Ajouter Presidio : anonymisation / masquage PII, socle RGPD.
Ajouter llm-d : blueprints + charts Kubernetes pour industrialiser les déploiements.
Ajouter Dynamo : orchestration inférence multi-nœuds.
Ajouter GuideLLM : capacity planning / benchmark réaliste.
Ajouter NeMo Guardrails : garde-fous et politiques.
Coût unitaire par tâche : chaque API doit exposer son prix/ml/token en temps réel — pas une facture mensuelle.
Qualité auto : précision/hallucination rate branchés sur les sorties IA, avec rollback automatique si qualité < seuil.

Backlog / Veille Technologique

Agents IA & Orchestration

meetily — Assistant IA de reunion local avec transcription Parakeet/Whisper en direct, diarisation et resume Ollama. 100% local, aucun cloud.
DesktopCommanderMCP — Serveur MCP pour Claude : controle terminal, recherche fichiers et edition de diffs.
codex-plugin-cc — Utiliser Codex depuis Claude Code pour reviewer du code ou deleguer des taches.
CubeSandbox — Sandbox instantanee, concurrente, securisee et leger pour agents IA.
herdr — Multiplexeur d'agents qui vit dans votre terminal.
claude-video — Donner a Claude la capacite de regarder des vidéos : download, extraction frames, transcription.
OfficeCLI — Suite Office construite pour agents IA : lire, modifier, automatiser Word, Excel, PowerPoint en binaire unique.
archify — Skill agent : generer de beaux diagrammes d'architecture avec export PNG/JPEG/WebP/SVG.
claude-skills — 345 skills et plugins pour agents de codage (30+ agents, 70+ commandes, 330+ skills) pour Claude Code, Codex, Gemini CLI, Cursor, et 8+.
chrome-devtools-mcp — Chrome DevTools pour agents de codage via MCP.
Paperclip — Orchestrateur open-source pour coordonner et superviser une équipe d'agents IA autonomes
OpenClaw
codegraph — Indexation locale des graphes de code pour agents (Hermes, Claude, Codex sync auto).
Understand-Anything — Transforme tout code en graphe de connaissances interactif explorable et questionnable.
OpenHands — Agent IA autonome pour le développement logiciel
Dify — Plateforme de développement d'applications IA (LLM Ops)
browser-use — Framework pour contrôler les navigateurs via des agents IA
LangChain — Framework pour applications basées sur les LLM
FlowiseAI — Build LLM apps visually
Rasa — Framework open-source pour chatbots et assistants vocaux
codebase-memory-mcp - Serveur MCP haute performance pour l'indexation de codebases en graphe de connaissances persistant.
Agent-Reach - Donnez des yeux a vos agents IA pour naviguer le web entier (Twitter, Reddit, YouTube, GitHub) en CLI, sans frais API.
SkillSpector - Scanner de securite pour les competences d'agents IA : detecte vulnerabilites, patterns malveillants et risques.
flue - Framework sandbox pour agents IA -- isolation et execution securisee de plugins/agents.
agent-skills - Skills d'ingenierie de qualite production pour les agents de codage IA (Claude, Cursor, etc.).

deer-flow - SuperAgent open-source a horizon long : recherche, codage et creation avec sandboxes, memoires, outils, sous-agents et passerelle de messages.
Orca - ADE pour travailler avec une flotte d'agents paralleles. Lancez n'importe quel agent de codage avec votre propre abonnement, disponible sur desktop et mobile.
agent-toolkit-for-aws - Serveurs MCP, competences et plugins officiels supports par AWS pour aider les agents IA a construire sur AWS.
cognee - Plateforme de memoire IA open-source pour agents. Offrez a vos agents une memoire a long terme persistante via un moteur de graphe de connaissances auto-hebergt.
page-agent - Agent GUI en-page JavaScript. Controlez les interfaces web en langage naturel.
agent-native - Framework pour construire des applications natives pour agents IA.
hallmark - Competence design anti-AI-slop pour Claude Code, Cursor et Codex.
code-review-graph - Graphe d'intelligence locale du code pour MCP et CLI ; construit une carte persistante du codebase pour les outils IA.
kimi-code - Le CLI agent Kimi Code : point de depart pour les agents de nouvelle generation.
jcode - Le harnais d'agent le plus intelligent pour le code.
awesome-llm-apps - Plus de 100 applications IA, competences d'agents et apps RAG - libre et open source.
pi - Boite a outils agent IA : API LLM unifiee, boucle agent, TUI, CLI agent de codage.
openinterpreter - Agent de codage pour les modeles ouverts comme Kimi K3.
i-have-adhd - Skill pour agent de codage qui arrete le discour de cacher la reponse. Sortie ADHD-friendly.
pi-web - Interface web pour agent de codage PI avec commandes et interfaces.
skills - Skills provenant directement du repertoire .agents d'un ingenieur reelement experimente.
text-to-cad - Collection de skills agent pour CAO, robotique et conception hardware.

Audio & TTS

Supertonic-3 — TTS léger pour inférence locale, ONNX Runtime, zéro cloud
faster-whisper (mutualisé) — Transcription speech-to-text optimisée
Qwen3-Omni-30B-A3B-Instruct — Modèle multimodal Qwen (audio + texte + image)
nemotron-3.5-asr-streaming-0.6b — Modèle ASR streaming NVIDIA, faible latence pour transcription temps réel

Génération & Édition d'Images

HiDream-O1-Image — Modèle unifié pixel-level (UiT), sans VAE externe — t2i, édition, personnalisation jusqu'à 2048×2048

RAG & Traitement de Documents

RAG sur PDF avec images
granite-docling-258M — Parsing structuré de documents IBM Granite
Haystack — Framework RAG end-to-end (deepset)
Mem0 — Mémorie à long terme pour agents IA
meilisearch — Moteur de recherche full-text

Stirling-PDF - Application PDF #1 sur GitHub : traitement complet des PDF sur tous les appareils.
Ossie - Standard open-source Apache pour les metadonnees semantiques entre analytics, IA et BI.

APIs à Développer

Classificateur IA — Classification de contenu
Résumé mutualisé — API de résumé de texte partagée
NER — Reconnaissance d'entités nommées
Compressor — Compression de contenu

Infrastructure & Backend

OmniRoute — Passerelle IA gratuite : un endpoint, 231+ providers (50+ free), compression 15-95% tokens.
Temporal — Orchestration de workflows critiques
Semantic Router — Routage sémantique de requêtes vLLM
Supabase — Alternative open-source Firebase (PostgreSQL, Auth, etc.)
Metabase — Analytics et dashboards open-source
N8N — Workflow automation open-source
iroh - Stack reseau modulaire en Rust -- decentralise, base sur des cles plutot que des IP.
LMCache - Couche KV cache ultra-rapide pour les LLM -- reduit drastiquement la latence d'inference.
Meshery - Gestionnaire cloud native open-source -- observabilite et orchestration multi-cluster.
worldmonitor - Tableau de bord de renseignement global en temps reel : aggregation IA de news et suivi d'infrastructure.
openship - Plateforme de deploiement auto-hebergeee et auto-deployee avec travaux automatiques.

Outils Dev

Aider — Assistant de codage IA en ligne de commande
Continue — Extension IDE IA (VS Code, JetBrains)
wigolo - Web local-first pour agent de codage — recherche, fetch, crawl et recherche via MCP, sans clee API.
MCP LLM — Modèle de langage via Model Context Protocol

Assistants IA & outils cloud

Assistants IA

Assistants IA auto-hébergés

Hermes WebUI + Ollama + GPU

Stack typique pour assistant privé, API OpenAI-compatible et expérimentation locale.

Développement, modèles & veille

Découverte de modèles

Models Trending

Évaluation & benchmarks

Agentic Evaluation

Outils de développement & fine-tuning

Matériel IA & GPU

NVIDIA GH200
DGX Spark
GROQ LLM accelerator

API Realtime AI (DEV)

Statut : environnement DEV, remplaçante prévue de l’API OpenAI pour les cas temps réel.

Configuration

Variable	Valeur
OPENAI_API_BASE	`wss://api-realtime-ai.ailab.infocepo.com:wait-2026-12/v1`
OPENAI_API_KEY	`sk-XXXXX`

Dépôt GitHub

ynotopec/api-realtime-ai

Page de test

external-test/half-duplex.html — annulation d’écho + mode half-duplex.

Compatibilité

Remplacer l’URL OpenAI par $OPENAI_API_BASE pour tester compatibilité et performances.

API LLM (OpenAI compatible)

URL de base : https://api-nothink.ailab.infocepo.com/v1
Création du token : OPENAI_API_KEY
Documentation : Documentation API

Liste des modèles

curl -X GET \
  'https://api-nothink.ailab.infocepo.com/v1/models' \
  -H 'Authorization: Bearer sk-XXXXX' \
  -H 'accept: application/json' \
  | jq | sed -rn 's#^.*id.*: "(.*)".*$#* \1#p' | sort -u

Modèles ouverts & endpoints internes

Dernière mise à jour : 2026-06-30

Les modèles ci-dessous correspondent à des endpoints logiques exposés derrière une passerelle.

Endpoint	Description / usage principal
ai-thinking	qwen3.6 fp8 – thinking
ai-fast	qwen3.6 fp8 en mode fast – vision/OCR/ai-default
ai-embedding	bge-m3 – recherche sémantique
ai-stt	whisper3-turbo – transcription vocale multilingual
ai-tts	OmniVoice – TTS multilingual
ai-image	OpenDalle – image génération

Exemple bash

export OPENAI_API_MODEL="ai-default"
export OPENAI_API_BASE="https://api-nothink.ailab.infocepo.com/v1"
export OPENAI_API_KEY="sk-XXXXX"

promptValue="Quel est ton nom ?"
jsonValue='{
  "model": "'${OPENAI_API_MODEL}'",
  "messages": [{"role": "user", "content": "'${promptValue}'"}],
  "temperature": 0
}'

curl -k ${OPENAI_API_BASE}/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d "${jsonValue}" 2>/dev/null | jq '.choices[0].message.content'

Vue infra LLM

File:Litellm-proxy-mermaid-diagram-2024-03-24-205202.png

DEV (au choix)

A. LiteLLM → vLLM/SgLang : tests perf / compatibilité
B. LiteLLM → Ollama : simple, rapide à itérer
C. Ollama direct : POC ultra-léger

DEV – modèle FR / résumé

LiteLLM → Ollama /v1

PROD

Standard : LiteLLM → vLLM/SgLang
Pont DEV→PROD : LiteLLM (DEV) → LiteLLM (PROD) → vLLM/SgLang

Notes :

LiteLLM = passerelle unique (clés, quotas, logs)
vLLM/SgLang = performance / stabilité en charge
Ollama = simplicité de prototypage

API Image to Text

Utilise l’API LLM avec un endpoint adapté à l’OCR / VLM.
Modèle recommandé : ai-vision

Exemple bash

OPENAI_API_KEY=sk-XXXXX

base64 -w0 "/path/to/image.png" > img.b64

jq -n --rawfile img img.b64 \
'{
  model: "ai-vision",
  messages: [
    {
      role: "user",
      content: [
        { "type": "text", "text": "Décris cette image." },
        {
          "type": "image_url",
          "image_url": { "url": ("data:image/png;base64," + ($img | rtrimstr("\n"))) }
        }
      ]
    }
  ]
}' > payload.json

curl https://api-nothink.ailab.infocepo.com/v1/chat/completions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  --data-binary @payload.json

Exemple Python

import base64
import json
import requests
import os

API_KEY = os.getenv("OPENAI_API_KEY")
MODEL = "ai-vision"
IMG_PATH = "/path/to/image.png"
API_URL = "https://api-nothink.ailab.infocepo.com/v1/chat/completions"

with open(IMG_PATH, "rb") as f:
    img_b64 = base64.b64encode(f.read()).decode("utf-8")

payload = {
    "model": MODEL,
    "messages": [
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Décris cette image."},
                {
                    "type": "image_url",
                    "image_url": {"url": f"data:image/png;base64,{img_b64}"}
                }
            ]
        }
    ]
}

headers = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

response = requests.post(API_URL, headers=headers, data=json.dumps(payload))

if response.ok:
    print(json.dumps(response.json(), indent=2, ensure_ascii=False))
else:
    print(f"Erreur {response.status_code}: {response.text}")

API STT

URL : https://api-audio2txt.ailab.infocepo.com/v1
Clé : OPENAI_API_KEY=sk-XXXXX
Modèle : whisper-1
Documentation : API STT docs

Exemple Python

import requests

OPENAI_API_KEY = 'sk-XXXXX'

url = 'https://api-audio2txt.ailab.infocepo.com/v1/audio/transcriptions'
headers = {
    'Authorization': f'Bearer {OPENAI_API_KEY}',
}
files = {
    'file': ('file.opus', open('/path/to/file.opus', 'rb')),
    'model': (None, 'whisper-1')
}

response = requests.post(url, headers=headers, files=files)
print(response.json())

Exemple curl

[ ! -f /tmp/test.ogg ] && wget "https://upload.wikimedia.org/wikipedia/commons/1/17/Fables_de_La_Fontaine_Livre_1_01.ogg" -O /tmp/test.ogg

export OPENAI_API_KEY=sk-XXXXX

curl https://api-audio2txt.ailab.infocepo.com/v1/audio/transcriptions \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F model="whisper-1" \
  -F file="@/tmp/test.ogg"

Notes

Plusieurs formats audio sont acceptés.
Le flux final est normalisé en 16 kHz mono.
Pour une qualité optimale : privilégier OPUS 16 kHz mono.

UI

translate-rt

API TTS

URL : https://api-tts-omnivoice.ailab.infocepo.com/v1
Clé : OPENAI_API_KEY=sk-XXXXX
Documentation : API TTS docs

Exemple

export OPENAI_API_KEY=sk-XXXXX

curl https://api-tts-omnivoice.ailab.infocepo.com/v1/audio/speech \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o-mini-tts",
    "input": "Bonjour, ceci est un test de synthèse vocale.",
    "voice": "coral",
    "instructions": "Speak in a cheerful and positive tone.",
    "response_format": "opus"
  }' | ffplay -i -

API Text to Image

URL : https://api-txt2image.ailab.infocepo.com/v1
Clé API : OPENAI_API_KEY=sk-...
Documentation : API TXT2IMAGE docs

Exemple

export OPENAI_API_KEY=EMPTY

curl https://api-txt2image.ailab.infocepo.com/v1/images/generations \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
    "prompt": "a photo of a happy corgi puppy sitting and facing forward, studio light, longshot",
    "n": 1,
    "size": "1024x1024"
  }'

API Diarization

Documentation : API Diarization docs

Exemple

wget "https://upload.wikimedia.org/wikipedia/commons/6/60/Mike_Peters_on_Politics_and_Emotion_%28Interview_1984%29.mp3" -O /tmp/test.mp3

curl -X POST "https://api-diarization.ailab.infocepo.com/upload-audio/" \
  -H "Authorization: Bearer token1" \
  -F "file=@/tmp/test.mp3"

API Summary

Documentation : API Summary docs

Exemple

text="The tower is 324 metres tall and is one of the most recognizable monuments in the world."

json_payload=$(jq -nc --arg text "$text" '{"text": $text}')

curl -X POST https://api-summary.ailab.infocepo.com:wait-2026-12/summary/ \
  -H "Content-Type: application/json" \
  -d "$json_payload"

API Text Embeddings

URL : https://api-embedding.ailab.infocepo.com/v1
Documentation : Documentation

Exemple

curl -k https://api-embedding.ailab.infocepo.com/v1/embeddings \
  -X POST \
  -d '{"model":"bge-m3","input":"What is Deep Learning?"}' \
  -H 'Content-Type: application/json'

API DB Vectors (ChromaDB)

Production

URL : https://chromadb.ailab.infocepo.com:wait-2026-12
Token : XXXXX

Lab

export CHROMA_HOST=https://chromadb.c1.ailab.infocepo.com:wait-2026-12
export CHROMA_PORT=443
export CHROMA_TOKEN=XXXX

Exemple curl

curl -v "${CHROMA_HOST}"/api/v1/collections \
  -H "Authorization: Bearer ${CHROMA_TOKEN}"

Exemple Python

import chromadb
from chromadb.config import Settings

def chroma_http(host, port=80, token=None):
    return chromadb.HttpClient(
        host=host,
        port=port,
        ssl=host.startswith('https') or port == 443,
        settings=(
            Settings(
                chroma_client_auth_provider='chromadb.auth.token.TokenAuthClientProvider',
                chroma_client_auth_credentials=token,
            ) if token else Settings()
        )
    )

client = chroma_http(CHROMA_HOST, CHROMA_PORT, CHROMA_TOKEN)
collections = client.list_collections()
print(collections)

Déployer sa propre instance

export nameSpace=your_namespace
domainRoot=ailab.infocepo.com

helm repo add chroma https://amikos-tech.github.io/chromadb-chart/
helm repo update

helm upgrade --install chromadb chroma/chromadb -n ${nameSpace} \
  --set chromadb.apiVersion="0.4.24" \
  --set ingress.enabled=true \
  --set ingress.hosts[0].host="${nameSpace}-chromadb.${domainRoot}" \
  --set ingress.hosts[0].paths[0].path=/ \
  --set ingress.hosts[0].paths[0].pathType=ImplementationSpecific \
  --set ingress.annotations."cert-manager\.io/cluster-issuer"=letsencrypt-prod \
  --set ingress.tls[0].secretName=${nameSpace}-chromadb.${domainRoot}-tls \
  --set ingress.tls[0].hosts[0]="${nameSpace}-chromadb.${domainRoot}"

kubectl -n ${nameSpace} patch ingress/chromadb --type=json \
  -p '[{"op":"add","path":"/metadata/annotations/nginx.ingress.kubernetes.io~1proxy-body-size","value":"0"}]'

Récupérer le token

kubectl --namespace ${nameSpace} get secret chromadb-auth \
  -o jsonpath="{.data.token}" | base64 --decode && echo

Registry

URL : registry.ailab.infocepo.com:wait-2026-09
Login : user
Password : XXXXX

Exemple

curl -u "user:XXXXX" https://registry.ailab.infocepo.com:wait-2026-09/v2/_catalog

Exemple K8S

deploymentName=
nameSpace=

kubectl -n ${nameSpace} create secret docker-registry pull-secret \
  --docker-server=registry.ailab.infocepo.com:wait-2026-09 \
  --docker-username=user \
  --docker-password=XXXXX \
  --docker-email=contact@example.com

kubectl -n ${nameSpace} patch deployment ${deploymentName} \
  -p '{"spec":{"template":{"spec":{"imagePullSecrets":[{"name":"pull-secret"}]}}}}'

Stockage objet externe (S3)

Endpoint : https://s3.ailab.infocepo.com:wait-2026-09
Access key : XXXX
Secret key : XXXX

Un bucket nommé ORG a été créé pour stocker des documents de démonstration.

RAG optimisation

Embeddings : BAAI/bge-m3
chunk_size=1200
chunk_overlap=100
LLM : qwen3.6
Pour les PDF mixtes : PDF → image → OCR / VLM peut améliorer les résultats.

Workflow

Autoroute directe : code → CI/CD → deploy → monitoring. Pas de comité, pas de responsable désigné — chaque étape se déclenche automatiquement si la précédente passe. Si ça rate, alerte directe sans passer par un humain sauf décision explicite de fallback.

Environnements

Hors production

Utiliser datalab
Support : canal Mattermost Offre IA
Le pseudo utilisateur doit respecter la convention interne
Demander si besoin un accès Linux + Kubernetes

Production (best-effort)

Publier le code applicatif, les secrets (format SOPS), le Dockerfile et le code infra (Helm ou manifests K8S) sur Git
Demander un namespace
Lire la documentation de surveillance associée

Limites de l’infrastructure

Les charges GPU sont intentionnellement limitées en journée.
Coût unitaire mesuré automatiquement (dashboards temps réel, pas Excel).

Cloud Lab & projets d’audit

Le Cloud Lab fournit des scénarios reproductibles : audit d’infrastructure, migration cloud, automatisation, haute disponibilité.

Projet d’audit

ServerDiff.sh

Script Bash d’audit permettant de :

détecter les dérives de configuration,
comparer plusieurs environnements,
préparer un plan de migration ou de remédiation.

Exemple de migration cloud

Tâche	Description	Durée (jours)
Audit infrastructure	82 services, audit automatisé via ServerDiff.sh	1.5
Diagramme d’architecture	Conception visuelle et documentation	1.5
Contrôles de conformité	2 clouds, 6 hyperviseurs, 6 To RAM	1.5
Installation plateforme cloud	Déploiement des environnements cibles	1.0
Vérification de stabilité	Premiers tests fonctionnels	0.5
Étude d’automatisation	Identification des tâches répétitives	1.5
Développement des templates	6 templates, 8 environnements, 2 clouds / OS	1.5
Diagramme de migration	Illustration du processus	1.0
Écriture du code de migration	138 lignes (voir MigrationApp.sh)	1.5
Stabilisation	Validation de la reproductibilité	1.5
Benchmark cloud	Comparaison vs legacy	1.5
Réglage des temps d’arrêt	Calcul du downtime	0.5
Chargement VM	82 VMs : OS, code, 2 IP par VM	0.1
Total		15 jours.homme

Vérifications de stabilité (HA minimale)

Action	Résultat attendu
Extinction d’un nœud	Tous les services redémarrent automatiquement sur les autres nœuds
Extinction / redémarrage simultané de tous les nœuds	Les services repartent correctement après reboot

Autonomie testée : vérifier que la migration fonctionne seule en tirant le repo et lançant le script, sans personne qui connaît le système de tête.

Architecture web & bonnes pratiques

Principes de conception :

privilégier une infrastructure simple, modulaire et flexible,
rapprocher le contenu du client (GDNS ou équivalent),
utiliser des load balancers réseau (LVS, IPVS),
comparer les coûts et éviter le vendor lock-in,
pour TLS :
- HAProxy pour les frontends rapides,
- Envoy pour les cas avancés (mTLS, HTTP/2/3),
pour le cache :
- Varnish, Apache Traffic Server,
favoriser les stacks open-source,
utiliser files, buffers, queues et quotas pour lisser les pics.

Références

Comparatif des grandes plateformes cloud

Fonctionnalité	Kubernetes	OpenStack	AWS	Bare-metal	HPC	CRM	oVirt
Outils de déploiement	Helm, YAML, ArgoCD, Juju	Ansible, Terraform, Juju	CloudFormation, Terraform, Juju	Ansible, Shell	xCAT, Clush	Ansible, Shell	Ansible, Python
Méthode de bootstrap	API	API, PXE	API	PXE, IPMI	PXE, IPMI	PXE, IPMI	PXE, API
Contrôle routeur	Kube-router	Router/Subnet API	Route Table / Subnet API	Linux, OVS	xCAT	Linux	API
Contrôle firewall	Istio, NetworkPolicy	Security Groups API	Security Group API	Linux firewall	Linux firewall	Linux firewall	API
Virtualisation réseau	VLAN, VxLAN	VPC	VPC	OVS, Linux	xCAT	Linux	API
DNS	CoreDNS	DNS-Nameserver	Route 53	GDNS	xCAT	Linux	API
Load balancer	Kube-proxy, LVS	LVS	Network Load Balancer	LVS	SLURM	Ldirectord	N/A
Stockage	Local, cloud, PVC	Swift, Cinder, Nova	S3, EFS, EBS, FSx	Swift, XFS, EXT4, RAID10	GPFS	SAN	NFS, SAN

Cette table sert de point de départ pour choisir la bonne stack selon :

le niveau de contrôle souhaité,
le contexte (on-prem, cloud public, HPC…),
les outils d’automatisation existants.

Haute disponibilité, HPC & DevSecOps

Haute disponibilité avec Corosync & Pacemaker

Principes :

clusters multi-nœuds ou multi-sites,
fencing via IPMI,
provisioning PXE / NTP / DNS / TFTP,
pour 2 nœuds : attention au split-brain,
3 nœuds ou plus recommandés en production.

Ressources fréquentes

multipath, LUNs, LVM, NFS,
processus applicatifs,
IP virtuelles, DNS, listeners réseau.

HPC

orchestration de jobs (SLURM ou équivalent),
stockage partagé haute performance,
intégration possible avec des workloads IA.

DevSecOps

CI/CD avec contrôles de sécurité intégrés,
observabilité dès la conception,
scans de vulnérabilité,
gestion des secrets,
policy-as-code.

News & trends

Formation & apprentissage

Transformers Explained
Labs, scripts et retours d’expérience concrets dans le projet Cloud Lab

Liens cloud & IT utiles

Outils collaboratifs

Dépôts de code

GitHub ynotopec

Base de connaissance

ce wiki

Messagerie

contact interne / support selon les projets

SSO

Keycloak

MLflow

MLFlow

À propos & contributions

Suggestions de corrections, améliorations de schémas, retours d’expérience ou nouveaux labs bienvenus.

Ce wiki a vocation à rester un laboratoire vivant pour l’IA, le cloud et l’automatisation.

Main Page: Difference between revisions

Latest revision as of 15:14, 27 July 2026

infocepo.com – Cloud, AI & Labs

Accès rapide

Portail principal

Assistant IA

Liste des pages du wiki

Vue d’ensemble

Démarrer rapidement

Parcours recommandés

Vue d’ensemble du contenu

Vision

Catalogue rapide des services

Nouveautés

Nouveautés 20/07/2026

Priorités

Top tasks

Backlog / Veille Technologique

Agents IA & Orchestration

Audio & TTS

Génération & Édition d'Images

RAG & Traitement de Documents

APIs à Développer

Infrastructure & Backend

Outils Dev

Assistants IA & outils cloud

Assistants IA

Développement, modèles & veille

Matériel IA & GPU

API Realtime AI (DEV)

Configuration

Dépôt GitHub

Page de test

Compatibilité

API LLM (OpenAI compatible)

Liste des modèles

Modèles ouverts & endpoints internes

Exemple bash

Vue infra LLM

API Image to Text

Exemple bash

Exemple Python

API STT

Exemple Python

Exemple curl

Notes

UI

API TTS

Exemple

API Text to Image

Exemple

API Diarization

Exemple

API Summary

Exemple

API Text Embeddings

Exemple

API DB Vectors (ChromaDB)

Production

Lab

Exemple curl

Exemple Python

Déployer sa propre instance

Récupérer le token

Registry

Exemple

Exemple K8S

Stockage objet externe (S3)

RAG optimisation

Workflow

Environnements

Hors production

Production (best-effort)

Limites de l’infrastructure

Cloud Lab & projets d’audit

Projet d’audit

Exemple de migration cloud

Vérifications de stabilité (HA minimale)

Architecture web & bonnes pratiques

Références