
Não é possível falar sobre Voz sobre IP (VoIP) sem antes explicar um pouco o que é a Internet e o protocolo TCP/IP.
No fim dos anos 60, o departamento de defesa americano iniciou pesquisas no sentido de interligar as redes de computadores militares dos Estados Unidos. O desafio era interligar várias redes que utilizavam tecnologias diferentes e proprietárias de forma a permitir a troca de informações entre elas.
Como as pesquisas iniciaram durante a guerra fria, havia uma grande preocupação em criar uma rede que permitisse que a interligação entre todos os pontos não fosse vulnerável a ataques. No caso, não deveria haver um único centro de comutação das comunicações e sim uma arquitetura distribuída que permitisse que, se uma base (militar) ou parte da rede fosse destruída, a troca de informações entre as demais continuasse intacta.
As pesquisas levaram à criação da ARPANET (Advanced Research Projects Agency Network). A ARPANET foi criada utilizando um protocolo idêntico ao hoje conhecido TCP/IP (Transfer Control Protocol / Internet Protocol).
As principais características que tornaram este protocolo ideal para a construção da ARPANET foram: a transmissão dos dados em forma de pacotes que independem da tecnologia das máquinas/redes da origem e do destino, o fato da conexão ser estabelecida fim-a-fim (entre as máquinas de origem e destino, independentemente do caminho que os dados percorrerem) e a possibilidade de roteamento dinâmico na rede, o que quer dizer que o caminho percorrido será decidido pelos equipamentos da rede (roteadores), conforme as condições do momento.
Dos fins militares, a ARPANET chegou ao meio acadêmico em meados dos anos 70, estando presente em várias instituições pelo mundo nos anos 80, como uma grande rede de troca de informações científicas e pesquisas. No fim dos anos 80, o crescimento da ARPANET era exponencial e diversas redes no mundo encontravam-se interligadas por ela, fazendo com que esta grande rede passasse a ser conhecida como Internet. A abertura comercial da grande rede para conexão de órgãos governamentais e empresas privadas fez a Internet se expandir rapidamente até chegar aos lares das pessoas.
Apesar do TCP/IP não ser um protocolo muito rápido, tornou-se o padrão oficial da Internet por suas características que permitem, por exemplo, que um usuário que utiliza o sistema operacional Windows consiga se comunicar através da Internet com usuários do sistema operacional Linux, e por suas características de segurança no que se refere à entrega de dados. Por essas características, diz-se que o TCP é best-effort (melhor esforço), pois o mesmo foi desenvolvido de maneira que a qualquer custo a informação seja entregue ao destino, mesmo que isto acarrete atrasos na transmissão. O que garante esta entrega, é uma série de regras de comunicação entre a origem e o destino dos dados, que permite inclusive que pacotes "perdidos" no meio de transmissão sejam retransmitidos até a completa transmissão de todas as informações.
Diz-se então que o protocolo TCP é orientado à conexão ou protocolo com conexão, pois desde o início da transmissão até seu término, é estabelecido um circuito virtual entre a origem e o destino que independe do meio por onde as informações estão trafegando.
Entretanto, quando falamos em transmissão de voz (ou mesmo vídeo), consideramos que a mesma precisa ser em tempo real, pois do contrário é impossível a troca de informações simultâneas entre duas pessoas, assim como ocorre em uma ligação telefônica feita pela rede pública de telefonia.
Mas, se o TCP só garante a entrega das informações sem evitar atrasos, como utilizá-lo para transmitir voz em tempo real? A resposta é utilizar o UDP (User Datagram Protocol). O UDP é um protocolo de comunicação integrante do sistema TCP/IP que, ao contrário do TCP, não é orientado à conexão (protocolo sem conexão) e, portanto, não garante a entrega ou integridade dos dados transmitidos. No entanto, o UDP permite que as informações possam ser transmitidas com maior rapidez, um pacote atrás do outro, num efeito chamado "rajada de dados" e que, dentro de uma rede com pouca perda de pacotes, alta velocidade de transmissão e pequeno atraso na entrega dos pacotes, permitirá a transmissão de voz (ou vídeo) em tempo real.