Speex
Le Speex est un codec de la parole de du logiciel gratuit qui peut être employé sur des applications de VoIP et des réclamations de Podcasts Speex de pour être exempt de toutes les restrictions du brevet et est autorisé sous le permis révisé de schéma du (3-clause). Il peut être employé avec le format de récipient de d'Ogg ou être directement transmis au-dessus d'UDP / RTP .
Les concepteurs de Speex voient leur projet comme complémentaire au projet d'usage universel de la compression audio de Vorbis .
Speex est un format de lossy , signifiant que la qualité est de manière permanente dégradée pour réduire la taille de fichier de fichier.
Description
À la différence de beaucoup d'autres codec de la parole, Speex n'est pas visé aux téléphones portables mais plutôt à la voix de au-dessus d'IP (VoIP) et compression dossier-basée. Les buts de conception ont été de faire un codec qui serait optimisé pour la parole de qualité et le bas débit binaire. Pour réaliser ceci les débits binaires multiples d'utilisations de codec, et des appuis ultra-à large bande (32  ; Taux de prélèvement de de kilohertz ), à large bande (16  ; taux de prélèvement de kilohertz) et bande étroite (qualité de téléphone, 8  ; taux de prélèvement de kilohertz). Concevoir pour la voix au-dessus d'IP ( VoIP ) au lieu d'utilisation de téléphone portable signifie que Speex doit être robuste aux paquets perdus, mais pas a corrompu ceux puisque l'User Datagram Protocol (UDP) de s'assure que les paquets arrivent inchangé ou n'arrivent pas. Tout ceci a mené au choix de la prévision linéaire excitée par code (CELP) de comme technique de codage pour employer pour Speex. Une des raisons principales est que CELP a longtemps montré qu'il pourrait réaliser le travail et le mesurer bien aux deux débits binaires de bas (comme démontré par DoD CELP @ 4.8  ; Kbit/s) et débits binaires élevés (comme avec G.728 @ 16  ; Kbit/s). Les caractéristiques principales peuvent être récapitulées comme suit :Le logiciel gratuit /open-source de , le brevet et la redevance - libérer
Intégration de bande étroite et de bande large dans le même bit-stream
Éventail de débits binaires disponibles (de 2  ; Kbit/s à 44  ; Kbit/s)
Commutation et dynamiques de débit binaire variable (VBR) de débit binaire
Détection d'activité de voix (VAD, intégrés avec VBR)
Complexité variable
mode Ultra-à large bande à 32  ; kilohertz (jusqu'à 48  ; kilohertz)
Option stéréo de codage de l'intensité
Dispositifs
; Taux de prélèvement : Speex est principalement conçu pour trois taux de prélèvement différents : 8  ; kilohertz (le même taux de prélèvement pour transmettre le téléphone appelle), 16  ; kilohertz, et 32  ; kilohertz. Ceux-ci désigné respectivement sous le nom de la bande étroite, de la bande large et d'ultra-à large bande. ; Qualité : Le codage de Speex est commandé le plus souvent par un paramètre de qualité qui s'étend de 0 à 10. Dans l'opération de débit binaire (CBR) constante, le paramètre de qualité est un nombre entier , alors que pour de débit binaire variable (VBR), le paramètre est un vrai (virgule flottante ) nombre. ; Complexité (variable) : Avec Speex, il est possible de varier la complexité permise pour l'encodeur. Ceci est fait en commandant comment la recherche est exécutée avec un nombre entier s'étendant de 1 à 10 d'une manière dont est semblable aux -1 à -9 options aux utilités de la compression de Gzip . Pour l'usage normal, le niveau de bruit à la complexité 1 est entre 1 et 2  ; le DB plus haut qu'à la complexité 10, mais les conditions de l'unité centrale de traitement pour la complexité 10 est environ cinq fois plus haut que pour la complexité 1. dans la pratique, la meilleure différence est entre la complexité 2 et 4, bien que des arrangements plus élevés soient souvent utiles quand le non-discours de codage ressemble à des tonalités du DTMF , ou si le codage n'a pas lieu en temps réel. ; De débit binaire variable (VBR) : De débit binaire variable (VBR) permet à un codec de changer son débit binaire dynamiquement pour s'adapter au " ; difficulty" ; de l'audio étant codé. Dans l'exemple de Speex, ressemble à des voyelles et les coupures de grande énergie exigent d'un débit binaire plus élevé d'atteindre la bonne qualité, alors que les fricatives (des bruits par exemple de s et de f) peuvent être codées en juste proportion avec peu de peu. Pour cette raison, VBR peut atteindre le débit binaire inférieur pour la même qualité, ou une meilleure qualité pour un certain débit binaire. En dépit de ses avantages, VBR a deux inconvénients principaux : d'abord, en spécifiant seulement la qualité, il n'y a aucune garantie au sujet du de débit binaire moyen final. En second lieu, pour certaines applications en temps réel aimer la voix de au-dessus d'IP (VoIP), quels comptes est le de débit binaire maximum, qui doit être assez bas pour la voie de transmission. ; Faire la moyenne de débit binaire (ABR) : De débit binaire moyen résout un des problèmes de VBR, car il ajuste dynamiquement la qualité de VBR afin d'atteindre une cible spécifique de débit binaire. Puisque la qualité/le de débit binaire est ajustée en temps réel (de boucle ouverte), la qualité globale sera légèrement inférieure à cela obtenue en codant dans VBR avec exactement le bon arrangement de qualité pour rencontrer le débit binaire moyen de cible. ; Détection d'activité de voix (VAD) : Une fois permise, la détection d'activité de voix détecte si l'audio étant codé est la parole ou bruit de silence/fond. VAD toujours est implicitement activé quand le codage dans VBR, ainsi l'option est seulement utile dans l'opération de non-VBR. Dans ce cas-ci, Speex détecte des périodes de non-discours et les code avec le juste assez de peu pour reproduire le bruit de fond. Ceci s'appelle le " ; Generation" du bruit de confort de ; (CNG). ; Transmission discontinue (DTX) : La transmission discontinue est une addition à l'opération de VAD/VBR, celle laisse cesser de transmettre complètement quand le bruit de fond est stationnaire. Dans un dossier, 5 bits sont employés pour chaque armature de disparus (correspondant à 250  ; bit/s). ; Perfectionnement perceptuel : Le perfectionnement perceptuel est une pièce du décodeur qui, une fois mis en marche, essaye de réduire (la perception de) le bruit produit par le codage/le processus de décodage. Dans la plupart des cas, le perfectionnement perceptuel rend le bruit autre à partir de l'original objectivement (rapport signal/bruit), mais à la fin il retentit toujours mieux (amélioration subjective). ; Retard algorithmique : Chaque codec présente un retard dans la transmission. Pour Speex, ce retard est égal à la taille d'armature, plus une certaine quantité de " ; regarder-ahead" ; requis pour traiter chaque armature. Dans l'opération à bande étroite (8  ; le kilohertz), le retard est 30  ; Mme, tandis que pour la bande large (16  ; le kilohertz), le retard est 34  ; Mme. Ces valeurs n'expliquent pas le temps- CPU qu'il prend pour coder ou décoder les armatures.
Grande base d'application
Il y a déjà une grande base des applications soutenant le codec de Speex, du coulant des applications de comme la téléconférence aux jeux vidéo et l'acoustique traitant des applications. Les la plupart de ces derniers sont basées sur le filtre de DirectShow , le de codec d'OpenACM Netmeeting sur le Microsoft Windows , ou le OpenH323 sur le Linux ( Ekiga ) de , par exemple. Il y a également les connexions pour le Winamp et des joueurs de MMX . Également joueur sain du KSP de la version 2006.2 et de l'appui Speex du Foobar2000 .Le type de supports pour Speex est audio/ogg tandis que contenu par Ogg, et audio/x-speex une fois transporté par RTP ou sans récipient.
Voir la page embrochable et de logiciel sur l'emplacement de speex.org pour plus de détails.
Le Xbox de phase de Microsoft emploie Speex pour les casques, comme annoncé par Ralph Giles, le défenseur de codec de Theora , sur le LugRadio .
Le derniers moteur et mods de la demi vie 1 emploient le codec de voice_speex.dll en tant que sa fonction de VoIP d'ingame. Bien qu'elle ne soit pas permise par défaut, les administrateurs de serveur doivent le permettre par l'introduction au clavier la console de leur serveur par le rcon ou au " physique d'ordinateur serveur ; voice_speex" de sv_voicecodec ;. Speex fournit une qualité bien meilleure que le codec de voix de milles de défaut.
Le système du guerrier de terre de de s d'armée Etats-Unis le le ', conçu par le General Dynamics , emploie également Speex pour VoIP sur un EPLRS transmettent par radio conçu par le Raytheon .
Dans la civilisation 4 de Sid Meier, Speex est employé pour coder les descriptions des technologies comme lu par le Leonard Nimoy .
Le Teamspeak de programme de VoIP emploie des codec de Speex en tant qu'un des 3 codec disponibles. la gamme de la qualité commence à partir de 3. Beaucoup de serveurs préfèrent le codec de Speex dû à sa bonne qualité avec peu ou beaucoup de personnes dans une chambre.
Le projet de Rockbox emploie Speex pour son interface de voix. Il peut également jouer des dossiers de Speex sur les joueurs soutenus, tels que l'iPod ou l'iRiver H10 d'Apple.
Voir également
comparaison des codec audio
SAD , une norme de propriété industrielle de compression audio de la parole
.
| Random links: | Banlieue noire de crique de ressort, comté d'élans, Pennsylvanie | Memphis Tams | Chemin de fer de Louisa | Pont d'avenue de Franklin | John M. Spalding | Speex |