A primeira parte dessa pergunta é sobre software de áudio.
Uma opção gratuita e de código aberto seria o Audacity. Isso permitirá que você isole a parte do áudio em que a outra pessoa está falando, simplesmente selecionando. Você pode aprender como usá-lo em seu Wiki.
Em termos comerciais, o Adobe Audition é vendido em seus pacotes do conjunto de criativos. Pode ser um exagero para o que você precisa.
Melhorar o som ou qualquer outro tipo de mídia é um negócio complicado.
Eu imagino que a voz da outra pessoa foi captada por um fone de ouvido ou alto-falantes. Aumentar o volume adicionará ruído, tornará as lacunas de frequência muito mais óbvias, aumentará os sons do ambiente e, em geral, fará com que o áudio pareça horrível. Não há muito que você possa fazer, afinal você não pode adicionar qualidade. Você pode mascarar a horribilidade embora.
O que você pode fazer é adicionar efeitos de-noise , disponíveis em Audition e Audacity . Isso geralmente é subjetivo a partir do áudio de origem e você pode perder mais do que gostaria, mas ajustado para as configurações corretas, você pode encontrar um midground entre perder menos ruído e perder menos áudio de origem.
Como você não esperava esse problema, não conseguiria evitar o máximo de ruído ambiente possível. Não importa o quão quieto você se mexeu na sua cadeira ou arranhou seu queixo, aumentar o volume tanto quanto você terá tornará estas ações muito óbvias. Às vezes, como esses costumam ser ruídos profundos, usar um efeito High Pass nessas áreas pode ajudar.
Uma conversa no Skype geralmente corta as altas e baixas freqüências no som. Impulsionar aqueles irá aumentar o ruído indesejado nessas frequências, mas fará com que a voz soe mais legível.