Forum

Pb d'importation de...
 
Notifications
Retirer tout

Pb d'importation de gros fichiers. dat

4 Posts
2 Utilisateurs
0 Reactions
4,674 Vu
(@acharrie)
New Member
Inscription: Il y a 6 ans
Posts: 0
Début du sujet  

Bonjour,

Merci pour la nouvelle version 2.0 que je viens de télécharger.

J'ai un problème lors de l'importation de gros fichiers .dat (317Mo). Une erreur apparait: Java heap space.

Comment faire pour de tels fichiers? Y a  t il un moyen d'augmenter la taille de la mémoire de la machine virtuelle?

Cela fonctionne bien pour des fichiers.dat plus légers.

Remarque:j'avais réussi à importer ce fichier sous l'ancienne version 1.6.1.

Merci pour votre aide

Bien cordialement


   
Citation
Étiquettes du sujet
(@vero)
Membre Admin
Inscription: Il y a 7 ans
Posts: 34
 

Bonjour

Oui il est possible (et même recommandé quand cela est possible !) d'augmenter la taille mémoire utilisée pour Proline. Pour passer à 16Go de mémoire allouée par exemple :

Si vous utilisez Proline Zero, il faut modifier le paramètre "server_max_memory = 16G" dans le fichier proline_launcher.config. La mémoire spécifiée sera "partagée" entre le serveur Proline et le serveur de base de données PostgreSQL.

Si vous utilisez la version Serveur, il faut modifier le fichier de lancement du serveur (start_cortex.bat ou start_cortex.sh selon que vous êtes sous Windows ou Linux ) :

"java -Xmx4G ... "

à changer en 

"java -Xmx16G"

 

Bonne Journée

Véronique


   
RépondreCitation
(@acharrie)
New Member
Inscription: Il y a 6 ans
Posts: 0
Début du sujet  

Bonjour,

J'avais effectivement oublié de mentionner qu'il s'agissait de proline zéro. Cela fonctionne nickel. Félicitations pour votre efficacité!

Me reste à régler le problème du recouvrement de séquence et là j'ai regardé les différents posts déjà mis mais j'avoue ne pas maitriser assez pour comprendre. Quand je vais dans l'onglet protein sequence, j'ai le message suivant: protein sequence not available in database. Dois je rentrer un fasta quelque part? 

Que je mette dans le fichier proline_launcher.config : disable sequence recovery en on ou en off cela ne change rien.

J'ai bien téléchargé le module PM-Sequence repository 0.8.0 dans le dossier proline.

Si ce n'est pas trop demandé, auriez vous une solution?

Bonne journée

Armelle

 


   
RépondreCitation
(@vero)
Membre Admin
Inscription: Il y a 7 ans
Posts: 34
 

Bonjour,

Il y a eu quelques posts en effet là dessus, c'est un point un peu compliqué... 

Voici une réponse que j'avais faite:

Dans ce cas, il doit s'agir d'un problème de configuration du module Sequence Repository... Ce module n'est pas le plus simple à configurer, il est vrai ! 

L'objectif de cette configuration est de permettre à Proline de retrouver l'identifiant de la protéine dans l'en-tête du fichier fasta afin de faire le lien entre les protéines importées dans Proline et celles décrites dans les fasta. De le même manière que l'on définit les "rules" dans Mascot.

Voici un post qui décrit la configuration :   http://www.profiproteomics.fr/forum/general-utilities/parsing-rules-for-sequence-repository/#post-8

Et une fois configurée, vous pouvez exécuter la commande : 

>run-TestConfiguration.bat 

pour tester la configuration. Ceci est décrit dans la documentation d'installation, dans la partie "Sequence Repository":   http://www.profiproteomics.fr/wp-content/uploads/2019/03/ProlineSuite_AdminGuide_2.0.docx.pdf#page=27

 

Si vous avez des difficultés pour cette partie,  nous pouvons vous aider si vous nous donnez un exemple d'entête fasta et l'ID qu'il faut extraire. 

Veronique

Comme je le disais, si vous avez des difficultés, nous pouvons essayer de nous contacter (par skype ou tél) pour y arriver. 

Véronique (veronique.dupierris à cea.fr)


   
RépondreCitation
Share: