J’ai visité le weekend des 10 et 11 septembre 2011 mon second IBC à Amsterdam. Avec le NAB de Las Vegas en avril, c’est l’un des plus grands salons professionnels au monde sur la vidéo et le cinéma. Il couvre à la fois la production, la gestion des données ainsi que la diffusion et la réception du cinéma et de la télévision.
Ce fascinant salon est le royaume de l’übergeek de l’image ! On y trouve du matériel professionnel de folie pour le tournage dédié au cinéma et télévision. Et puis il y a tout ce qu’il faut pour éditer et gérer les images et le son, puis les diffuser et les valoriser dans les salles de cinéma ou chez le consommateur avec set-top-boxes et TV connectées diverses. Bref, j’étais dans mon élément naturel puisque mon activité de conseil “métier” est spécialisée dans les métiers de l’image (vidéo, TV, cinéma, photo) !
Au vu de la richesse de ce salon, je vais en couvrir ce qui m’a marqué en plusieurs parties, en m’appuyant sur les photos que j’ai prises sur place. En commençant par la partie production avec les caméras, la prise de vue, l’éclairage et le matériel de studio. Ce sera la plus dense de ce compte rendu. On passera ensuite à la gestion et à la diffusion/réception des contenus. Je consacrerai enfin – en marge de l’IBC – un voire plusieurs articles aux entreprises françaises de ce secteur qui étaient comme l’année dernière nombreuses à exposer sur ce salon. Cela va vous changer du Guide des Startups ! Ceci nous occupera pas mal pendant ce qui reste du mois de septembre – voire au delà – sachant que début octobre, je vais visiter pour la première fois le CEATEC de Tokyo, qui est l’équivalent Japonais du CES de Las Vegas… en plus grand et plus exotique. De quoi entretenir la conversation sur ce blog !
Pour revenir à l’IBC, ce salon qui durait cinq jours a attiré 51000 visiteurs professionnels dont un tiers sont issus des 1365 exposants. Il a lieu dans le centre d’exposition RAI au sud d’Amsterdam. C’est un peu leur Parc des Expositions de la Porte de Versailles, mais en un deux fois moins grand.
Toutes mes photos prises à cet IBC sont dans les galeries de ce blog comme d’habitude. J’en ai profité pour ajouter mes photos de l’IBC 2010, sur ce lien.
L’émergence du 4K
Le standard actuel du cinéma numérique et de la télévision haute définition tournent actuellement autour du “2K”. Dans le cinéma, c’est le standard DCI 2K qui prédomine avec une résolution de 2048×1080 pixels et à 24 images par secondes. Dans la télévision, c’est le 1920×1080 entrelacé (1080i, pour le broadcast) ou non entrelacé (1080p, utilisé principalement dans les lecteurs Blu-ray) qui règnent. Mais avec une fréquence de 25 images par seconde (en Europe) et 30 images par seconde (aux USA). Le 2K et le 1080p sont de résolution voisine. Mais ce standard évolue progressivement vers le 4K qui double la résolution du 2K dans les deux sens (4096×2160), en commençant par la production cinématographique. Sachant que depuis déjà quelques années, la post-production des films et l’ajout d’effets spéciaux qui ont été numérisés bien avant les tournages eux-mêmes, sont déjà réalisés en 4K.
Alors, pourquoi cette course au 4K ? La raison est simple : cette résolution correspond à la résolution (grain) des films argentiques utilisés dans le cinéma. Le 4K permet donc d’obtenir une résolution théorique qui atteint celle du cinéma argentique. Sachant qu’en parallèle, les capteurs numériques des caméras se sont améliorés pour capter à la fois les nuances de couleur (visualisées dans le Gamut) et les hautes comme les basses lumières (dynamique).
Se pose alors la question de la taille des capteurs. Dans le cinéma numérique, on entend parler de “Super-35 mm” ou de “35 mm”. Depuis quelques années, je ne comprenais pas pourquoi je ne trouvais pas de capteur de caméras vidéo ou cinéma au format 24×36 mm. En fait, la raison est simple : cela n’existait pas dans le cinéma argentique ! Les plus grands capteurs de caméras numériques, aussi bien pour le cinéma que pour la télévision, sont de format 24,89×18,7 mm, soit environ la moitié de la taille d’un capteur full frame d’un Canon EOS 5D II. La raison ? Une image “full frame” d’un appareil photo 35mm correspond à environ le double de la taille d’une image 35 mm dans le cinéma car dans l’argentique, les images sont respectivement verticales (pour le cinéma) et horizontales (pour la photo) le long de la pellicule, comme expliqué dans le schéma ci-dessous de mon cru.
Cela explique pourquoi les réflex full frame sont très prisés des cinéastes. En effet, ils vont plus loin que les caméras de cinéma 35 mm en terme de contrôle et finesse de profondeur de champs. Plus un capteur est grand, plus on peut contrôler la profondeur de champs d’une prise de vue. A contrario, les petits capteurs qui équipent les smartphones et les appareils photos compacts ont une grande profondeur de champs (l’avant plan comme l’arrière plan sont nets). Bref, les réflex plein format (full frame) utilisés pour tourner de la vidéo sont en fait meilleurs que les meilleures caméras de cinéma pour ce qui est du contrôle de la profondeur de champs.
A l’IBC, j’ai fait un tour sur le stand de l’allemand ARRI, qui est l’un des leaders historiques des caméras de cinéma, depuis l’argentique. Leur gamme de référence est la série des caméras Alexa. Elles génèrent des images 2K avec un capteur CMOS 35 mm (en fait, 24,9 x 18,7mm) permettant d’utiliser les optiques des caméras 35 mm argentiques. La résolution du capteur est supérieure à celle du 2K, soit 3392×2200 mais la partie utile est de 2880×1620 pour le ratio 1,77 du 16/9. Les vues peuvent être tournées de manière classique à 24 images par seconde et monter jusqu’à 120 FPS (frames per seconds) pour les ralentis. Sur le stand, on pouvait voir la nouvelle Alexa M (ci-dessous) qui a la particularité de séparer le capteur du reste de la caméra et de connecter les deux par fibre optique. Ce qui permet de l’utiliser sur des supports légers, notamment sur des grues, pour de la 3D ou pour des tournages de cascades.
La connexion des caméras par fibre optique était aussi proposée chez Grass Valley (ci-dessous, ex Thomson) en 3 Gbits/s, ce qu’il faut pour faire du Full HD broadcast pour remplacer les câblages coaxiaux au format SDI. On trouve aussi de plus en plus de systèmes de transmission sans fil de la vidéo. Ils existent depuis longtemps et se sont adaptés à la HD. Les derniers systèmes, qui fonctionnent dans la bande de fréquence 1.3 à 7.5 GHz, voire même en Wifi classique, utilisent maintenant le codec H264 qui est plus efficace en compression.
Sur le stand ARRI, on pouvait voir une grosse bête (ci-dessous), le ARRI Scanner, qui sert à scanner des films argentiques 35 mm pour les numériser. La marque propose aussi son ARRI Laser, qui fait le contraire, en transférant des images numériques sur des films 35 mm. Il faut bien cela pour créer des contre-négatifs qui vont servir à générer des positifs envoyés dans les salles de cinéma. Tous les films tournés en numériques passent par ce processus car toutes les salles ne sont pas encore équipées en projection numérique. C’est le cas d’environ 50% des salles en France et le pourcentage est évidemment plus élevé dans les pays hors du G7.
Côté 4K, deux marques se sont distinguées sur l’IBC : Sony et JVC, sans compter RED qui propose des caméras 4K et 5K. La nouvelle Sony CineAlta F65 (ci-dessous) qui est dotée d’un capteur Sony CMOS 8K de 20 millions de pixels qui fait 24,7mm x 13,1mm, soit le ratio 1:1,88 qui est voisin de celui des films de cinéma tournés en Panavision (avec une bande noire en haut et en bas lorsqu’affichés sur un écran 16/9). La caméra est faite pour générer du 4K dans tous les ratios de format du cinéma, et en RAW (image non compressée) et avec une dynamique de 16 bits (voir la documentation).
Pourquoi un capteur 8K ? Parce que cela permet d’avoir une plus grande densité de photosites et de générer par dématricage une image 2K plus nette sachant que les photosites sont organisés en diagonale (schéma ci-dessous, à droite). En effet, les capteurs 2K dotés de 2 millions de photosites génèrent tous une image 2K par interpolation. Comme dans la photo, la confusion est grande entre photosites (qui sont rouges, verts et bleus) et pixels (qui sont un point avec son information RGB et qui nécessite donc 3 photosites au minimum; comme ils ne sont généralement pas superposés, l’information RGB est calculée par interpolation avec les photosites avoisinants). Bon, bref, c’est un peu compliqué. Sur le stand Sony, j’ai pu voir un court-métrage de démonstration tourné avec cette F675 : “The Arrival”, et projeté sur un très grand écran. C’était très impressionnant de qualité photographique, de contrastes et de qualité des couleurs.
J’ai sinon trouvé pas mal de caméras conçues spécialement pour tourner des ralentis, comme la VFC-700 Flash Eye de l’américain ForA (ci-dessous) qui va jusqu’à 700 FPS en Full HD ou la Fastcam SA6 de chez Photron (aussi américain) qui monte à 1500 FPS. On peut aussi citer l’allemand PS-Technik, avec sa PS-X35 qui tourne jusqu’à 450 images par secondes.
Curieusement, ces caméras étaient démontrées dans des montages de studio. Elles doivent plutôt servir en extérieur, comme pour tourner des compétitions sportives.
Et la 3D dans tout ça ? Et bien, ce n’est pas un reflux, mais cela mobilisait moins les exposants cette année, en phase avec la réaction quelque peu timide des consommateurs, surtout pour ce qui est de l’équipement domestique. Bien entendu, tous les fabricants de caméras (comme ARRI, ci-dessous) et ceux qui proposent des “rigs” (supports de montage de caméras) ont des rigs pour le tournage 3D. Le plus courant est le rig à miroir où une caméra est horizontale et l’autre verticale, avec un miroir semi-réfléchissant séparant la vue pour alimenter les deux caméras, et de manière légèrement décalée pour générer la stéréoscopie (exemple ci-dessous, toujours chez Arri, avec deux Alexa M). Le problème de ces systèmes mécaniques réside dans la précision du montage et dans leur pilotage. En effet, ces caméras doivent converger vers le plan de référence de la prise de vue. Et cette convergence mécanique dépend de la distance de ce plan de référence par rapport à la caméra. Tout ceci est de plus en plus piloté par des servo-moteurs de précision. Et les images générées doivent de plus être alignées par logiciel en post-production. Deux sociétés françaises présentes sur le salon se distinguent de ce point de vue là : Binocle et Stéréolabs.
Pour terminer sur les caméras, il me faut citer ces extraordinaires démonstrations de bout en bout d’images Super-Hi Vision, une technologie résultant d’un partenariat entre la NHK, la BBC et des industriels japonais comprenant Hitachi, JVC, Sharp et Ikegami. Le Super-Hi Vision est aussi appelé le 16K. C’est une technologie vidéo de 8Kx4K pixels, plus précisément : 7680 × 4320 pixels. Cela représente quatre fois le Full HD dans les deux directions, ou deux fois le 4K que nous avons précédemment évoqué. J’avais vu l’année dernière une belle projection sur écran d’images de ce genre. Très bluffant, d’autant plus qu’elles sont associées à un son 22.2. Oui, 22 canaux et 2 canaux pour les caissons de basses. Cela permet d’avoir un son spatialisé en 3D, qui vient du plafond, de la hauteur d’écoute et du sol. Il y a trois étages de hauts parleurs avec ce système. C’est évidemment d’abor prévu pour équiper les salles de cinéma.
La grande nouveauté sur le stand de la NHK était la présentation d’un écran LCD 16K de Sharp. Jusqu’à présent, je n’avais pu voir à l’IBC et au CES que des écrans plats 4K. Il faut dire que cet écran 16K de Sharp n’existe pour l’instant qu’à l’état de prototype et en trois exemplaires dans le monde. Une image 16K fait 32 mpixels, soit plus qu’un réflex full frame classique comme le Canon 5D Mark II qui fait 21 mpixels ! Sauf que c’est de la vidéo ! Un 5D II fait bien de la vidéo, mais “seulement” en 1080p.
On pouvait même voir cet écran à l’œuvre en direct, projetant une image tournée avec une caméra Ikegami 16K juste à côté. A choisir entre très haute résolution et 3D, j’ai une préférence : la très haute résolution. Cela améliore autant le réalisme de l’image que la 3D et surtout, cela ne fatigue pas du tout, contrairement à tous les systèmes d’affichage 3D, qu’ils utilisent des lunettes passives ou actives, ou pas de lunettes du tout. Petit détail : le flux numérique pour une image 16K est d’environ 300 Mbits/s et on peut le comprimer pour descendre à environ 100 Mbits/s. Prochaines expérimentations en vue ? La BBC va tourner les jeux olympiques de Londres avec cette technologie !
Ah, et puis, la salle de projection était équipée avec un curieux projecteur 16K de JVC. Il utilise un système à base de technologie D-ILA, une variante du LCOS, si vous suivez (c’est une matrice LCD sur un miroir, qui réfléchit les rayons lumineux d’une ampoule). La matrice est au format 4K et ils utilisent une bidouille mécanique et avec des filtres pour afficher 16K. Il y avait un schéma qui expliquait cela mais je n’ai pas bien compris le fonctionnement !
Alors, quand est-ce que le 16K va entrer en production ? Prenez votre temps ! La roadmap, optimiste, de la NHK (ci-dessous) évoque 2020. Et il faudra d’abord en passer par le 4K !
Avec ce premier article, nous n’avons couvert que les caméras ! Dans l’article suivant, je me penche sur les optiques “extrêmes”, sur la prise de vue vidéo panoramique, sur l’éclairage à LED, sur les studios de télévision virtuels. Ca fera encore un bon gros article !
Reçevez par email les alertes de parution de nouveaux articles :
ou pas de lunettes du tout. Petit détail : le flux numérique pour une image 16K est d’environ 300 Mbits/s et on peut le comprimer pour descendre à environ 100 Mbits