feat(nouser): centroid_model — versionado de embeddings

Protege contra el bug silencioso de mezclar centroides de modelos distintos (mock 32-d vs real 384-d), que daría scores sin sentido. - MonadManifest.centroid_model: Option<String>. None = legacy. - nouser_core::embed::MODEL_ID = "nouser-pseudo-32d". Cluster lo setea en cada Mónada que genera. - nouser-nous-mock reusa la misma constante (use nouser_core::embed::MODEL_ID): produce vectores idénticos al cluster local, reportar el mismo ID es honesto. - nouser-nous-real ya reportaba "real-fastembed-allMiniLML6V2-384d"; el filter ahora lo descarta automáticamente cuando los centroides cacheados son del mock. - cmd_attract: - Captura el model_id del embedding del target. - Filtra Mónadas cuyo centroid_model no matchee. - Reporta "embed: <source> (<model>)" y "skipped: N" cuando descarta. Resultado: cambiar de mock a real vía BRAHMAN_BROKER_CONTEXT=prod hace que attract filtre las Mónadas viejas con cero score en lugar de fingir que las puede comparar. Tests: 7 (card) + 24 (core) verdes. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-09 00:24:38 +00:00
parent 9c371ee43e
commit 820a1a33bf
6 changed files with 89 additions and 17 deletions
@@ -39,7 +39,11 @@ use tokio::io::{AsyncBufReadExt, AsyncWriteExt, BufReader};
 use tokio::net::{UnixListener, UnixStream};
 use tracing::{info, warn};

-const MODEL_ID: &str = "mock-pseudo-32d";
+/// El mock implementa el MISMO algoritmo que `nouser_core::embed`,
+/// así que reportamos el mismo `MODEL_ID` que él. De otro modo el
+/// consumer filtraría las Mónadas como "modelo distinto" y los
+/// scores quedarían vacíos.
+const MODEL_ID: &str = nouser_core::embed::MODEL_ID;

 #[tokio::main(flavor = "current_thread")]
 async fn main() -> std::io::Result<()> {