Estou tentando analisar alguns dados de negociação para analisar basicamente quais locais de negociação parecem ter um efeito prejudicial na negociação de P & L. Estou usando o Excel (por falta de uma opção melhor) e estou lidando com registros de 1m +.
Para dar uma ideia de como são os dados, quando uma negociação é enviada, essa ordem 'pai', por exemplo, $ 1 milhão, é dividida em 10 ordens menores 'de 100 mil', que depois saem para locais de negociação. Quero analisar o que acontece com o preço que alcançamos para as ordens subsequentes de um filho quando enviamos o primeiro filho para uma determinada troca. A conclusão pode ser que, quando enviamos nosso primeiro pedido para filhos à NYSE, as ordens subseqüentes recebem preços ruins, em geral, de várias centenas de milhares de pedidos de pais.
Assim, os dados simplificados parecem mais ou menos assim:
parent order child order venue price vs benchmark(bps)
1 1 NYSE 0
1 2 LSE -0.8
2 3 Deutsche 0.3
2 4 BATS 0
2 5 NYSE -1.02
. . . .
. . . .
. . . .
Como posso agrupar os dados por pai e, em seguida, detalhar isso para analisar, para todas as instâncias que o primeiro pedido vai para a NYSE, por exemplo, o que acontece com o preço versus o valor de referência para filhos subsequentes desse mesmo pedido pai?
Tags microsoft-excel