V2.4 - Various workflows and documentation improvments
Next release corresponding to different improvements of the pipeline:
1 Contexte scientifique
Le workflow commence à être de plus en plus complet.
Il faut rajouter le co-assemblage et améliorer la performance en s'affranchissant de prokka de manière prioritaire.
Puis faire un benschmark du workflow et le publier.
2 Description de la demande
Amélioration diverses du WF cf issues.
3 Organisation
3.1 Planning
Octobre 2022 : correction de quelques bug (conflits mineurs lors du dernier merge et plus important enlever la vérification du clustering car il pose un problème)
Octobre 2022 - fin novembre 2022 : Co-assemblage et enlever prokka pour une meilleure solution (plus rapide)
En parallèle : trouver un jeu de données simulé (CAMI) pour faire le benschmark et commencer à écrire la publi.
Mi-octobre - début décembre : benschmark des principaux outils concurrents
décembre : obtenir un V1 du papier
3.2 Personnes
Implémentation : Maïna et Jean et Vincent
Tests et revue du code : Claire, Maïna, Jean et Vincent
4. Échéancier
voir planning
5 Critères de validation
Nos trois jeux de tests sont ok !
Test du pipeline : Claire et Jean sur projets réels
6 Bilans et modifications du planning et des ressources
6.1 Bilan du 18 octobre
Décision de faire un hotfix 2.3.1 avec les bugs trouvés (verif CD-Hit, plus conflits non résolus) rapidement. Fin octobre. Puis une release avec co-assemblage et modification de l'annotation des contigs fin novembre.
6.2 Update du 28 octobre
Le hotfix 2.3.1 est fait depuis hier.
6.3 Bilan du 2 décembre
Octobre 2022 : correction de quelques bug (conflits mineurs lors du dernier merge et plus important enlever la vérification du clustering car il pose un problème) ==> fait dans les temps
Octobre 2022 - fin novembre 2022 : Co-assemblage et enlever prokka pour une meilleure solution (plus rapide) : un peu de retard Maïna prévoit de finir mi-décembre. Pour prokka c'est fini aujourd'hui car on a eu un peu de retards suite aux tests. Mais les corrections ont été faites.
En parallèle : trouver un jeu de données simulé (CAMI) pour faire le benschmark et commencer à écrire la publi. ==> Changement de plan : on ne benschmark plus tout le workflow mais juste les spécificités longues lectures en comparant avec le WF pacbio. Pour le reste on se contente de faire du qualitatif.
Mi-octobre - début décembre : benschmark des principaux outils concurrents ==> plus d'actualité sauf pour le HiFi
Fin décembre : obtenir un V1 du papier Jean recode bin_refinement de metawrap pour permettre N sets de bins ce qui nous permettrait de rajouter les contigs circulaires comme un set de bins. Fin décembre.
6.4 Bilan du 20 janvier 2023
Benschmark HiFi à faire avec la nouvelle release de metagWGS qui sortira avant la fin du mois de janvier. Sera fait en février : CH Le papier a prit du retard par manque de temps mais un premier travail bibliographique des outils concurrents à été fait. CH Février. Binette ; qui remplace avantageusement le bin_refinement de metawrap a été codé comme prévu et intégré dans metaGWGS. Il reste quelques améliorations à faire.
Point ressources : Jean et Maïna terminent leur contrat fin janvier. Donc Claire va devoir se débrouiller. Vincent reste en support le jeudi et vendredi jusque fin février.
6.5 Bilan du 27 janvier 2023
La release 2.4 a été faite hier. Les 2 images sont faites aussi. Testé sur le jeu de données small c'est ok. tester avec les deux jeux de données HiFi Mock pacbio et les 3 tiers de flowcell seqOccIN. Cela s'est fini ce matin correctement. Fin du contrat de Maïna et Jean.