Je ne sais pas si ça interesse quelqu’un, mais mon problème est tout simple. Je n’ai pas de GPU sur le serveur. Ollama n’utilise que 4 core CPU sur les 24 disponibles. Avec le prompt d’HA (10k caractères), le temps de réponse est de 59 minutes, soit 1000 fois trop long.
Il va me falloir un GPU avec 16Go de mémoire, soit un investissement de 800€. Ca ne sera pas pour tout de suite …