Sous-titrons ensemble les vidéos de Paris Web 2011

Chers tous,

Depuis plusieurs jours, nous nous sommes lancés dans le sous-titrage des vidéos de l'édition 2011. Avec l'aide de plusieurs d'entre-vous nous avons réussi à transcrire et sous-titrer (non sans peine ^^) une première vidéo, malheureusement nous ne sommes pas aussi efficaces que nous le pensions.

Afin qu'un plus grand nombre d'entre-vous puisse nous aider quelques minutes ou quelques heures, nous avons décidé de davantage nous organiser.

Vous êtes prêt à donner un coup de main à Paris Web pour rendre plus accessibles les vidéos les conférences ? Ce qui suit est donc pour vous.

1ère étape : la transcription

La transcription (ou le transcript) consiste à recopier littéralement toutes les informations vocales de la vidéo (orateur, questions du public, etc.).

Afin de faciliter le travail collaboratif, nous utilisons un outil fournit par Framasoft qui permet d'éditer un texte à plusieurs.

Pour les vidéos du grand amphithéâtre nous proposons de démarrer à partir du texte transcrit par vélotypie en direct de l'événement. Cela évite le stress de la page blanche !

Les vidéos en cours de transcription sont les suivantes (de préférence, attaquez les dans l'ordre) :

Sous-titrage étape 1 par parisweb

2ème étape : la relecture

Lorsqu'un transcript est terminé, une ou deux relectures complètes ne sont pas de trop. Cette étape peut se faire en écoutant la vidéo afin de vérifier que ce qui a été transcrit correspond à ce qui a été dit, mais aussi sans écouter la vidéo, afin de faciliter la chasse aux fautes d'orthographe ou de frappe.

Si vous avez participé à la relecture d'un transcript, signalez-le simplement en ajoutant une remarque au début du transcript (pensez à mettre la partie relue si vous n'avez pas vérifié le transcript en entier).

Les transcripts en cours de relecture sont les suivants :

  • (de prochaines vidéos à venir)
 
Sous-titrage étape 2 par parisweb

3ème étape : le découpage

Le découpage consiste à adapter le texte pour qu'il soit correctement sous-titré. Il est impératif que les étapes 1 et 2 soient terminées avant d'entamer le découpage. Les sous titres apparaissent sur deux lignes dans nos lecteurs vidéos. Il faut donc découper le texte par blocs d'une ou deux lignes. La longueur approximative d'une ligne est de 35 caractères, il faut veiller à ne pas dépasser la limite de 45 à 50 caractères qui provoquerait des problèmes d'affichage.

Par exemple, le transcript suivant

"Alors, par exemple coupez le son de votre ordinateur et regardez la vidéo et votre sous-titrage. Si là vous comprenez ce qui a été dit, c'est que c'est un bon sous-titrage..."

Devient après découpage :

"Alors, par exemple coupez le son de votre ordinateur
et regardez la vidéo et votre sous-titrage.

Si là vous comprenez ce qui a été dit,
c'est que c'est un bon sous-titrage..."

Les transcripts en cours de découpage sont les suivants :

  • (bientôt de nouvelles vidéos, nous l'espérons)
 
Sous-titrage étape 3 par parisweb

4ème étape : la synchronisation

La synchronisation permet d'ajouter une notion de temps sur ce qui a été dit : cette phrase doit par exemple apparaître entre 48'45 et 49'10.

Cette étape est faite à l'aide de l'outil de sous-titrage en ligne Universal Subtitle. Le texte de l'étape 3 est ainsi importé et synchronisé dans ce service en ligne.

Les sous-titres en cours de synchronisation sont les suivants :

       
      Sous-titrage étape 4 par parisweb

      5ème étape : l'export du fichier .srt et la publication des sous-titres

      L'équipe de Paris-Web s'occupe de cette dernière étape.

      Une fois la vidéo synchronisée dans Universal Subtitle nous exportons toujours les sous-titres au format SRT. Nous le mettons ensuite à disposition en téléchargement et le réimportons sur la plateforme de diffusion (actuellement Dailymotion)

      À ce jour, nous avons sous-titré trois vidéos de l'édition 2012 :

      Et pour terminer, quelques réponses à vos questions

      • Pourquoi vous n'utilisez-vous pas Universal Subtitle de bout en bout ?
        Nous trouvons que le service n'est pas adapté pour un travail collaboratif, la prise en main de l'outil n'est pas triviale et les risques d'erreurs sont nombreux.
        La méthode que nous proposons permet, selon nous, de donner la possibilité à tout le monde de participer.
      • Serons-nous cités pour l'aide fournie ?
        Oui, n'oubliez pas d'indiquer votre prénom, nom ou pseudo sur les transcriptions auxquelles vous participez pour que nous puissions vous créditer.
      • Qui contacter si besoin ?
        Si vous avez une question ou une suggestion, n'hésitez pas à nous écrire sur video@paris-web.fr.
      • Prévoyez-vous de transcrire et sous-titrer les conférences en anglais ?
        Oui, cependant dans un premier temps l'idéal serait de les sous-titrer dans la langue d'origine (en anglais). Nous organiserons par la suite des traductions.
      • Certains orateurs, peut-être même la plupart, « mangent » les négations en parlant. Je me demande s'il n'est pas préférable dans la transcription de mettre les négations, ceci afin de rendre le texte plus clair.
        La transcription est un "jeu" difficile. Il faut éviter de déformer ou changer les propos des orateurs, sauf si cela devient nécessaire pour la compréhension du texte. Par exemple, je commence une phrase puis passe totalement à autre chose. Il faudrait indiquer la phrase commencée, notamment parce que le texte va ensuite être sous-titré. Ça pourrait être difficile à comprendre sur la vidéo parce qu'on verrait l'orateur parler mais le sous-titrage serait différent. Modifier les phrases pour les rendre plus compréhensibles si nécessaire peut être fait lors de la phase de relecture.
        Pour répondre plus clairement à la question des négations, l'idéal est de se rapprocher du discours et donc de manger aussi les négations. Sauf si tu estimes que la compréhension est vraiment complexe. Le sous-titrage doit vraiment être proche du discours et sans reformulation dans l'idéal sauf si c'est indispensable ou sauf pour les "euh", "bin" qui peuvent être retirés car perturbants pour la lecture.
      • J'aurais tendance à utiliser les chevrons plutôt que les guillemets dactylographiques mais, étant donné que les chevrons imposent l'usage d'espace entre le texte et les guillemets, on risque d'avoir des sauts de lignes indésirables dans le texte final. À moins que tout cela ne soit résolu dans la dernière étape ?
        L'idéal est même de s'en passer. Effectivement pour la transcription ils sont intéressants, mais nous n'utilisons pas de guillemets sur le sous-titrage en général. Pour éviter de les retirer, l'idéal est donc de ne pas les utiliser.
      • Y a-t-il des préconisations sur la présentation de certaines choses, par exemple sur la façon de noter les remarques telles que [Applaudissements], sur l'emploi des italiques pour les noms des ouvrages, l'emploi des tirets ou des parenthèses. J'ai en général employé des tirets lorsque l'orateur faisait une parenthèse, mais je ne sais pas si c'est la meilleure solution. Le tout dans un souci d'harmonisation de tous les textes et afin qu'on ne change pas inutilement ce qu'un autre à fait, chacun ayant peut-être une façon différente de voir les choses.
        L'idéal est de se baser sur :http://www.dailymotion.com/video/xmdyi7_je-veux-un-vrai-sous-titrage_tech
        En quelques lignes :
        • Inutile d'utiliser le gras ou l'italique, le format .srt pour le sous-titrage ne permet pas de le restituer par la suite.
        • Il faut rappeler le nom de la personne à chaque fois qu'il y a un changement de parole. Sous la forme 
          • "Matt May (MM) : " pour la première occurrence
          • "MM : " pour les suivantes
          • "Auditeur : " pour les auditeurs dont on n'a pas le nom
        • Si l'orateur parle d'une traite pendant 20 minutes, il faut placer les paragraphes et les uns sous les autres, sans rappeler ses initiales.
        • Les bruits importants et sous-titrés sont signalés entre crochets, par exemple [rires], [applaudissements]
        • Les informations apportées par le transcripteur le sont entre parenthèses, par exemple "N'écoutez pas ce qu'il dit (en murmurant)"