Sous-titrons ensemble les vidéos de Paris Web 2011
Chers tous,
Depuis plusieurs jours, nous nous sommes lancés dans le sous-titrage des vidéos de l'édition 2011. Avec l'aide de plusieurs d'entre-vous nous avons réussi à transcrire et sous-titrer (non sans peine ^^) une première vidéo, malheureusement nous ne sommes pas aussi efficaces que nous le pensions.
Afin qu'un plus grand nombre d'entre-vous puisse nous aider quelques minutes ou quelques heures, nous avons décidé de davantage nous organiser.
Vous êtes prêt à donner un coup de main à Paris Web pour rendre plus accessibles les vidéos les conférences ? Ce qui suit est donc pour vous.
1ère étape : la transcription
La transcription (ou le transcript) consiste à recopier littéralement toutes les informations vocales de la vidéo (orateur, questions du public, etc.).
Afin de faciliter le travail collaboratif, nous utilisons un outil fournit par Framasoft qui permet d'éditer un texte à plusieurs.
Pour les vidéos du grand amphithéâtre nous proposons de démarrer à partir du texte transcrit par vélotypie en direct de l'événement. Cela évite le stress de la page blanche !
Les vidéos en cours de transcription sont les suivantes (de préférence, attaquez les dans l'ordre) :
- HTML5 APIs: Where no man has gone before par Robert Nyman
- Comment améliorer les performances avec l'usage mixé d'hébergeurs, CDN et Clouds ? par Stéphane Enten et Julien Coulon
- Les données ouvertes et liées (Linked Open Data) pour les allergiques au RDF par Olivier Thereaux
- Immediate Inspiration par Denise Jacobs
- Industrialisation de l'intégration Web : la révolution de l'artisan devenu ouvrier par Thomas Parisot
- Un navigateur, comment ça marche ? par Anthony Ricaud
- Table ronde des navigateurs
- Le web développement durable : Green IT à toutes les sauces par Christophe Clouzeau
- SEO, mobilité et accessibilité : la sainte trinité d'un développement Web inclusif par Denis Boudreau
- (de prochaines vidéos à venir)
2ème étape : la relecture
Lorsqu'un transcript est terminé, une ou deux relectures complètes ne sont pas de trop. Cette étape peut se faire en écoutant la vidéo afin de vérifier que ce qui a été transcrit correspond à ce qui a été dit, mais aussi sans écouter la vidéo, afin de faciliter la chasse aux fautes d'orthographe ou de frappe.
Si vous avez participé à la relecture d'un transcript, signalez-le simplement en ajoutant une remarque au début du transcript (pensez à mettre la partie relue si vous n'avez pas vérifié le transcript en entier).
Les transcripts en cours de relecture sont les suivants :
- (de prochaines vidéos à venir)
3ème étape : le découpage
Le découpage consiste à adapter le texte pour qu'il soit correctement sous-titré. Il est impératif que les étapes 1 et 2 soient terminées avant d'entamer le découpage. Les sous titres apparaissent sur deux lignes dans nos lecteurs vidéos. Il faut donc découper le texte par blocs d'une ou deux lignes. La longueur approximative d'une ligne est de 35 caractères, il faut veiller à ne pas dépasser la limite de 45 à 50 caractères qui provoquerait des problèmes d'affichage.
Par exemple, le transcript suivant
"Alors, par exemple coupez le son de votre ordinateur et regardez la vidéo et votre sous-titrage. Si là vous comprenez ce qui a été dit, c'est que c'est un bon sous-titrage..."
Devient après découpage :
"Alors, par exemple coupez le son de votre ordinateur
et regardez la vidéo et votre sous-titrage.
Si là vous comprenez ce qui a été dit,
c'est que c'est un bon sous-titrage..."
Les transcripts en cours de découpage sont les suivants :
- (bientôt de nouvelles vidéos, nous l'espérons)
4ème étape : la synchronisation
La synchronisation permet d'ajouter une notion de temps sur ce qui a été dit : cette phrase doit par exemple apparaître entre 48'45 et 49'10.
Cette étape est faite à l'aide de l'outil de sous-titrage en ligne Universal Subtitle. Le texte de l'étape 3 est ainsi importé et synchronisé dans ce service en ligne.
Les sous-titres en cours de synchronisation sont les suivants :
- Les neurosciences au service du design numérique par Marc Van Rymenant
- KISS dans une grande entreprise ? par Stéphane Deschamps
- Tester l'ergonomie de son site même sans budget par Maurice Svay
- Maîtrisez l'imprévu et le facteur humain dans votre conduite de qualité par Rudy Rigot
- L’accessibilité vue d’un grand compte et comment la loi de 2005 a changé nos façons de travailler par Arthur Rigaud
5ème étape : l'export du fichier .srt et la publication des sous-titres
L'équipe de Paris-Web s'occupe de cette dernière étape.
Une fois la vidéo synchronisée dans Universal Subtitle nous exportons toujours les sous-titres au format SRT. Nous le mettons ensuite à disposition en téléchargement et le réimportons sur la plateforme de diffusion (actuellement Dailymotion)
À ce jour, nous avons sous-titré trois vidéos de l'édition 2012 :
- Je veux un VRAI sous-titrage ! par Sophie Drouvroy
- Ouvrir le Web un bug à la fois par Karl Dubost
- Accessibilité : soyons agiles par Élie Sloïm et Laurent Denis
- (bientôt de nouvelles vidéos, nous l'espérons)
Et pour terminer, quelques réponses à vos questions
- Pourquoi vous n'utilisez-vous pas Universal Subtitle de bout en bout ?
Nous trouvons que le service n'est pas adapté pour un travail collaboratif, la prise en main de l'outil n'est pas triviale et les risques d'erreurs sont nombreux.
La méthode que nous proposons permet, selon nous, de donner la possibilité à tout le monde de participer. - Serons-nous cités pour l'aide fournie ?
Oui, n'oubliez pas d'indiquer votre prénom, nom ou pseudo sur les transcriptions auxquelles vous participez pour que nous puissions vous créditer. - Qui contacter si besoin ?
Si vous avez une question ou une suggestion, n'hésitez pas à nous écrire sur video@paris-web.fr. - Prévoyez-vous de transcrire et sous-titrer les conférences en anglais ?
Oui, cependant dans un premier temps l'idéal serait de les sous-titrer dans la langue d'origine (en anglais). Nous organiserons par la suite des traductions. - Certains orateurs, peut-être même la plupart, « mangent » les négations en parlant. Je me demande s'il n'est pas préférable dans la transcription de mettre les négations, ceci afin de rendre le texte plus clair.
La transcription est un "jeu" difficile. Il faut éviter de déformer ou changer les propos des orateurs, sauf si cela devient nécessaire pour la compréhension du texte. Par exemple, je commence une phrase puis passe totalement à autre chose. Il faudrait indiquer la phrase commencée, notamment parce que le texte va ensuite être sous-titré. Ça pourrait être difficile à comprendre sur la vidéo parce qu'on verrait l'orateur parler mais le sous-titrage serait différent. Modifier les phrases pour les rendre plus compréhensibles si nécessaire peut être fait lors de la phase de relecture.
Pour répondre plus clairement à la question des négations, l'idéal est de se rapprocher du discours et donc de manger aussi les négations. Sauf si tu estimes que la compréhension est vraiment complexe. Le sous-titrage doit vraiment être proche du discours et sans reformulation dans l'idéal sauf si c'est indispensable ou sauf pour les "euh", "bin" qui peuvent être retirés car perturbants pour la lecture. - J'aurais tendance à utiliser les chevrons plutôt que les guillemets dactylographiques mais, étant donné que les chevrons imposent l'usage d'espace entre le texte et les guillemets, on risque d'avoir des sauts de lignes indésirables dans le texte final. À moins que tout cela ne soit résolu dans la dernière étape ?
L'idéal est même de s'en passer. Effectivement pour la transcription ils sont intéressants, mais nous n'utilisons pas de guillemets sur le sous-titrage en général. Pour éviter de les retirer, l'idéal est donc de ne pas les utiliser. - Y a-t-il des préconisations sur la présentation de certaines choses, par exemple sur la façon de noter les remarques telles que [Applaudissements], sur l'emploi des italiques pour les noms des ouvrages, l'emploi des tirets ou des parenthèses. J'ai en général employé des tirets lorsque l'orateur faisait une parenthèse, mais je ne sais pas si c'est la meilleure solution. Le tout dans un souci d'harmonisation de tous les textes et afin qu'on ne change pas inutilement ce qu'un autre à fait, chacun ayant peut-être une façon différente de voir les choses.
L'idéal est de se baser sur :http://www.dailymotion.com/video/xmdyi7_je-veux-un-vrai- sous-titrage_tech
En quelques lignes :- Inutile d'utiliser le gras ou l'italique, le format .srt pour le sous-titrage ne permet pas de le restituer par la suite.
- Il faut rappeler le nom de la personne à chaque fois qu'il y a un changement de parole. Sous la forme
- "Matt May (MM) : " pour la première occurrence
- "MM : " pour les suivantes
- "Auditeur : " pour les auditeurs dont on n'a pas le nom
- Si l'orateur parle d'une traite pendant 20 minutes, il faut placer les paragraphes et les uns sous les autres, sans rappeler ses initiales.
- Les bruits importants et sous-titrés sont signalés entre crochets, par exemple [rires], [applaudissements]
- Les informations apportées par le transcripteur le sont entre parenthèses, par exemple "N'écoutez pas ce qu'il dit (en murmurant)"