thewild a écrit : 15 nov. 2019, 14:57Au sujet du watermarking de vidéo diffusées en streaming, ça se fait. On parle plus de fingerprinting que de watermarking. Le watermarking c’est utilisé pour authentifier quelque chose, le fingerprinting consiste à mettre un watermark différent pour chaque utilisateur afin de l’identifier.
Oui, mais non! Tu confonds les termes!
On va dé-mélanger tout ça et effectuer les distinctions qui s'imposent!
Le
fingerprinting n’ajoute absolument rien à une vidéo (
ou une musique). Ce n’est qu’une technique qui consiste à identifier un média dans le but d’empêcher des utilisateurs de mettre en ligne du contenu sous droit d’auteur sur des sites comme YouTube, entre autres. C’est donc bel et bien le
fingerprinting qui sert à authentifier un contenu multimédia
et pas le contraire!
Le
fingerprinting doit être associé à la notion d'
upload. (Le
watermarking, lui, à la notion de
download. Voir plus bas...)
Par exemple, si je suis un artiste, un producteur ou même propriétaire d’un site comme YouTube, je peux utiliser un logiciel qui analyse mon vidéo (
tel pixel de telle couleur à telle seconde, telle note ou telle mélodie à telle seconde, etc.) afin de créer un «
fingerprint » (
une emprunte digitale) de la vidéo ou de la musique.
Cette « empreinte » est ensuite ajouté dans une basse de donnée sur les serveurs des sites qui hébergent des vidéos (
ou des musiques) et est utilisé afin de comparer avec les analyses que le site (
YouTube, par exemple) effectue sur les vidéos que mettent en ligne les utilisateurs. Si correspondance il y a, ben le site retire la vidéo et/ou informe l’utilisateur qu’il a mis en ligne un média qui est protégé par droit d’auteur.
Autrement dit et pour faire simple, le
fingerprinting dispense juste de devoir payer des employés devant visionner toutes les vidéos mises en ligne afin de s’assurer que ce ne sont pas des vidéos commerciales et/ou protégées par droit d’auteur. C’est uniquement un processus
automatisé de reconnaissance de contenu (
sur des sites d'hébergement où l'on peut uploader des vidéo).
Ça ne modifie pas la vidéo et
ça ne lui ajoute rien!
Par exemple, si LePsychoSophe «
download » une vidéo de Vimeo et tente ensuite de l’uploader sur YouTube, ben si le propriétaire de la vidéo a fait affaire avec une « entreprise de
fingerprinting » et/ou à lui-même utilisé un logiciel de
fingerprinting et a transmis l’emprunte à YouTube, ben YouTube va reconnaître que la vidéo que tente de mettre en ligne LePsychoSophe correspond à l’une des empreinte présente dans sa base de données. Mais cette empreinte
n’est pas liée d’une quelconque façon à LePsychoSophe. Elle sert juste à identifier la vidéo, à dire «
cette vidéo n’est pas nouvelle, elle existe et appartient à quelqu’un d’autre ».
C’est ce qui explique que plusieurs YouTubers connus mentionnent parfois qu’ils doivent faire attention et ne peuvent plus, même dans le cadre de reportages et critiques, mettre des extraits de vidéos et de musique, car plus le temps avance, plus les propriétaires de contenu (
artistes, Majors, etc.) transmettent des empreintes dans les basses de donnée. En fait, en pratique, YouTube le fait lui-même pour se protéger et créer lui-même une empreinte lorsque, par exemple, un artiste très connu met en ligne sa vidéo sur son compte officiel. Du coup tous ceux qui tentent de mettre un extrait de la musique ou de la vidéo dans leur propre vidéo sont susceptibles d’être reconnus par les algorithmes de YouTube qui scannent sans arrêt toutes les vidéos mises en ligne.
Cela a même créé un tollé et plusieurs frustrations de la part de certains YouTubers car l’algorithme est parfois « trop » efficient et parvient à reconnaître, ne serait-ce qu’un court passage de 15 secondes (
présent que pour une critique, P. Ex.) dans une vidéo de 30 minutes où le mec parle de tout et de rien.
Bref, c’est
un tout autre sujet!
Que faut-il saisir de tout ça?
Que si je télécharge le dernier vidéo-clip de, P. Ex., Lana Del Rey sur YouTube ou Vimeo et que je le partage à mes potes via mail ou dropbox, ben cette vidéo
ne contient rien de spécial. C’est juste que si je tente de l’
uploader à mon tour sur ma chaîne YouTube, ben les algorithmes de YouTube reconnaîtront que c’est une vidéo de Lana Del Rey et ils la retireront de ma chaîne (
par conséquent, « l’ayant droit » pourrait aussi prendre des mesures légales contre moi s’il juge que c’est nécessaire).
Voilà! Ça, c'était le
fingerprinting.
Et donc, non! Le
fingerprinting ne consiste pas du tout à mettre un
watermark différent pour chaque utilisateur qui
download afin de lier la vidéo à ces dernier pour pouvoir les identifier ensuite s'ils l'
uploadent ailleurs ensuite. Il consiste juste à créer une empreinte reconnaissable de la vidéo, empreinte qui est ajoutée non pas dans à la vidéo (
aucun intérêt de faire ça puisque c'est la vidéo en elle même qui est l'empreinte!), mais dans une basse de donnée afin de savoir si ce qui est
uploadé ne correspond pas déjà à une vidéo existante.
On peut faire une « image » avec la prise d'empreinte digitale par la police qui est ajoutée à la base de données de la police. Si plusieurs savants fous arrivent à faire de multiples clones identiques de moi-même et que la police met en état d'arrestation quelques-uns de mes clones, ben l'empreinte des clones correspondra à « Dash » dans leur base de données (un être qui existe et est fiché), mais en aucun cas elle permettra à la police de savoir combien de savant fous ni lequel des savants fous à cloné les Dash mis en état d'arrestation.
Maintenant, la technique qui consiste à ajouter un filigrane (
watermark, visible ou non) à une vidéo se nomme bel et bien, elle, le «
watermarking ». Et bien que possible techniquement, je persiste à dire que ce n’est pratiquement pas utilisé.
Pourquoi? Parce que c’est inutile dans la plupart des cas!
Pourquoi c’est inutile dans la plupart des cas?
Parce que ce que les propriétaires (
de vidéos) ne veulent pas, c’est que leur produit soit partagé en masse, par exemple sur des sites comme YouTube ou Vimeo (
via d'autres comptes que les leurs). Et dans ce cas, il est inutile de s’emmerder à
watermarker des milliers de versions différentes d’une même vidéo puisque dès qu’un utilisateur tente d’
uploader et d’héberger un contenu protégé par droit d’auteur sur un site comme YouTube, ben il est immédiatement identifié par son compte, son mail et l’IP associé de toute façon (
et de toute façon les algorithmes de YT réussissent à reconnaître, à cause des fingerprint, les vidéos et les suppriment automatiquement.). Et, de plus, comme on va le voir plus loin, sauf pour diffusion (
stream)
live (
en temps réel), il est possible de modifier/supprimer les
watermark. De plus, les vidéos — publics — downloadés de YouTube, Vimeo, Dailymotion, etc., ne peuvent pas contenir d'identificateur (
watermark) unique lié a un utilisateur puisqu'il n'est pas nécessaire de posséder un compte pour visionner.
Le
watermark n’est utile que dans des cadres particulier et très restreint où il n’est pas contraignant à effecteur sur des très petites quantités. Par exemple, je suis une petite boite qui bosse sur un projet et que j’envoie 10 copies à 10 collabos. Dans ce cas, oui, créer 10 versions différentes de la même vidéo avec chacune un
watermark différent pourrait m’être utile dans le cas où l’un d’eux mettrait le fichier sur du P2P. Dans ce cas, je pourrais savoir lequel des 10 collabos m’a trahi (
s'il n'est pas assez malin pour faire sauter le watermark).
Je simplifie et donne un exemple caricatural (
il existe d’autres situations/contextes possible), mais ce qui importe de savoir (
parce que c’était la question de LePsychoSophe), c’est que les vidéos présents sur Vimeo et YouTube quand on les télécharge (
peu importe le moyen) sont
les même pour tous! Si 2000 utilisateurs téléchargent la même vidéo sur Vimeo ou sur YouTube, les 2000 possèdent une vidéo
qui est la même (
sauf la résolution et le format qu’ils ont choisi lors de la conversion). Il
n’y a pas de watermark dans ces vidéos!
EDIT : les vidéos non payantes, celles accessibles sans compte d'utilisateur.
thewild a écrit : 15 nov. 2019, 14:57on crée deux copie de la vidéo originale avec chacune un watermark différent, A et B (on appelle ça A/B watermarking d’ailleurs). Lors de la diffusion, le serveur bascule entre ces deux vidéo à chaque frame pour créer un code binaire qui correspond à la session attribuée à l’utilisateur. Ainsi la vidéo contiendra alternativement des frames avec le watermark A et B (AAAABABBBABABBAAABA.....), ce qui constituera sa signature unique. Le tour est joué.
Oui et ça correspond exactement au fait que je dis que tout est possible en informatique!

Il y a toujours un moyen de faire quoi que ce soit. Le problème, c’est de bien distinguer de quoi l’on cause et de bien mettre en contexte, car sinon l’on peut toujours dire une chose et son contraire.
C’est important parce que sinon les gens font des « déductions naturelles » et mélangent un peu tout!

Par exemple, dans ta phrase, tu confonds naturellement «
signature unique » avec «
fingerprint » parce qu e(
du français à l'anglais), ça veut dire pratiquement la même chose. Sauf que selon les contextes, prendre le cliché, donc l'empreinte d'une vidéo n'est pas du tout la même chose que d'ajouter des marques différentes à toutes les copies que l'on donnera à plusieurs afin de lier chacune des copies à chacun des utilisateurs. Dans un cas, le produit pris en cliché est seulement répertorié dans une base de données afin d'être reconnu et dans l'autre chaque copie est marquée différemment et liée à un utilisateur unique. C'est complètement différent!
Pour ce genre de procédé, c’est encore relativement nouveau (
pas tant sur le principe/technique, mais surtout dans son application pratique) et, surtout pas du tout encore adopté et démocratisé. De plus, ce n’est vraiment utile que dans le cadre d’une
diffusion en temps réel où un utilisateur «
re-streamerait » une diffusion « live » lui aussi
en temps réel. Pour faire simple, en pratique, ça met des bâtons dans les roues à ceux, P., Ex., abonnés à un service de VOD Live (
combat de boxe, match de hockey, foot, etc.) qui tentent de rediffuser «
live » en
streaming l’événement sportif
au moment même où il est diffusé.
Sinon, pour diffusion ultérieure, il serait possible, comme tu le dis, de trafiquer les trames. Donc peu utile dans ce cas.
Donc au final, concernant les vidéos présentes sur YouTube, Vimeo, Dailymotion, etc. :
- elles sont nécessairement toute sous droit d’auteur puisqu’appartenant à leur propriétaire (
tout comme n’importe quelle musique, image ou photo d’ailleurs). En ce sens, légalement, nous n’avons pas le droit de les rediffuser et/ou les partager en public et/ou à d’autres personnes (
sauf les membres de notre famille et nos visiteurs à la maison) sans une autorisation de l’ayant droit. La plupart sont «
fingerprintées » en ce sens que YouTube peut reconnaître si l'on
upload des vidéos qui ne nous appartiennent pas, qui correspondent à des vidéos d'artistes connues, extrait de films connus, P., Ex.. Mais elles ne sont pas « marquées »,
watermarquées lorsqu'on visionne et/ou
donwload!
EDIT : les vidéos non payantes, celles accessibles sans compte d'utilisateur.
- dans les faits, dans un cadre privé, l’on peut faire ce que l’on veut sans être inquiété. Partager à quelques potes par mail, dropbox,etc., est
sans danger bien qu'illégal. ...à moins que notre pote ne communique avec l’ayant droit pour nous dénoncer!

...sauf que les ayants droit n’ont pas de temps à perdre avec si peu, ce qui les préoccupe, c’est la
rediffusion/partage de masse! Comme ceux, par exemple, qui vont re-
streamer illégalement un événement sportif d’envergure, etc.
- les vidéos — publics —
downloadés de YouTube, Vimeo, Dailymotion, etc. , ne
peuvent pas contenir d'identificateur (watermark) unique puisqu'il n'est pas nécessaire de posséder un compte pour visionner (
et télécharger) ces vidéos. Et, à ce jour (
peut-être que ça changera avec les années), même les vidéos payantes nécessitant un compte et un accès « membre »
ne contiennent probablement pas de marqueur unique sur ces grands sites qui hébergent des vidéos.
EDIT : À confirmer!
- les vidéos (
en fait tout contenu) présentes sur des sites de P2P ne peuvent pas être
watermarkées en fonction de ceux qui les téléchargent (télécharge =
download, à ne pas confondre avec l'
upload). Par contre, certaines « Majors » (
surtout pour les blockbusters américains) peuvent prendre des procédures et tenter de retracer les IP, en collaborant avec les autorités et les FAI. Donc sur les sites de P2P, L'utilisation d'un proxy, VPN, etc., est nécessaire pour ceux qui ne veulent pas qu'on puisse remonter jusqu'à eux.
Voilà!
Quelques sources qui expliquent et confirment tout ce que je partage :
Digital video fingerprinting (
wiki)
How Digital Fingerprinting Works (
7 pages)
Video Identification: What’s the Difference Between Video Watermarking and Fingerprinting?
How will YouTube's video fingerprinting work?
Securing OTT Content — Watermarking (
La technique « A/B » dont cause thewild.)
_____
Autres liens connexes :
Acoustic fingerprint
Automatic content recognition
_____
Attention de ne pas confondre tout ceci avec le «
Canvas fingerprinting » qui est autre chose et qui concerne les browsers (
souvant nommé « fingerprinting » sans le mot Canvas) .