Eles são, provavelmente, unidades relativas.
Então 0.4 0.1 0.45 0.5
se traduz em:
X = 0.4 * Width of video
Y = 0.1 * Height of video
W = 0.45 * Width of video
H = 0.5 * Height of video
Também é possível que os últimos 2 valores indiquem um deslocamento inferior e direito em vez de largura e altura .