Curation
Podcast Nicolas Boutin, CTO GoJob
Tout ce que vous avez toujours voulu savoir sur les botshits
Pleias publie un jeu de données d'un milliard de mots OCRisés corrigés par un LLM
Les LLM ont-ils leur propre vision du monde ?
Tout savoir sur les embeddings
Plus d’un enseignant-chercheur sur quatre envisage "de changer de métier dans les prochaines années" (enquête Iredu dépêche AEF)
FineWeb
Huggingface a utilisé 120k heures de GPU pour publier FineWeb
NER and token classification using GLiNER
QDora, quand finetuner un modèle devient accessible à (presque) tout le monde