Paper2Code: Automatisez la création de code à partir d'articles scientifiques.
Vous en avez assez de traduire manuellement des articles de recherche en code fonctionnel ? Découvrez Paper2Code, un système multi-agent LLM révolutionnaire conçu pour automatiser la génération de code à partir d'articles scientifiques en machine learning. Simplifiez votre flux de travail et gagnez un temps précieux.
Transformez vos articles en code : les avantages de Paper2Code
Paper2Code optimise la transformation d'articles de recherche en dépôts de code. Le système s'organise en trois étapes clés :
- Planification: Analyse initiale du document pour déterminer la stratégie de codage.
- Analyse: Extraction précise des informations nécessaires à l'implémentation.
- Génération de code: Production du code, en tenant compte des meilleures pratiques.
Cette approche structurée surpasse les solutions existantes en termes de fidélité et de qualité du code produit, comme démontré par les évaluations sur Paper2Code Benchmark.
Démarrage rapide avec Paper2Code
Vous voulez essayer Paper2Code immédiatement ? Voici comment faire tourner un exemple rapidement :
-
Installation des dépendances:
- Pour utiliser l'API OpenAI :
pip install openai
- Pour les modèles open source avec vLLM :
pip install vllm
- Pour utiliser l'API OpenAI :
-
Configuration de l'API OpenAI (si applicable) :
export OPENAI_API_KEY="<VOTRE_CLE_API>"
-
Exécution du script:
- Pour OpenAI API :
cd scripts && bash run.sh
- Pour les modèles open source :
cd scripts && bash run_llm.sh
- Pour OpenAI API :
Installation détaillée et configuration de Paper2Code
Envie de personnaliser l'installation ? Suivez ces étapes :
1. Préparation de l'environnement
Assurez-vous d'avoir installé les paquets nécessaires. Vous pouvez installer openai
et vllm
individuellement : pip install openai
et pip install vllm
2. Conversion de PDF en JSON
- Clonez le dépôt
s2orc-doc2json
:git clone https://github.com/allenai/s2orc-doc2json.git
- Lancez le service de traitement PDF :
cd ./s2orc-doc2json/grobid-0.7.3 && ./gradlew run
- Convertissez votre PDF en JSON :
3. Lancer Paper2Code
Adaptez les variables d'environnement si vous utilisez votre propre article scientifique.
- API OpenAI :
export OPENAI_API_KEY="<VOTRE_CLE_API>" ; cd scripts && bash run.sh
- Modèles Open Source :
cd scripts && bash run_llm.sh
Évaluation de la qualité des dépôts générés
Paper2Code propose une approche d'évaluation basée sur un modèle.
Configuration de l'environnement pour l'évaluation
Installez tiktoken
: pip install tiktoken
puis configurez l'API OpenAI : export OPENAI_API_KEY="<VOTRE_CLE_API>"
Évaluation sans référence (Reference-free)
Spécifiez le répertoire du dépôt généré (target_repo_dir
) :
Évaluation avec référence (Reference-based)
Indiquez le répertoire du dépôt généré (target_repo_dir
) et le répertoire du dépôt officiel (gold_repo_dir
) :
Explorez le Paper2Code Benchmark
Découvrez le jeu de données Paper2Code Benchmark dans data/paper2code
. Trouvez plus de détails dans la section 4.1 "Paper2Code Benchmark" de l'article. Accélérez votre recherche en machine learning avec Paper2Code !