In welke charset kan ik SMS-berichten aanleveren en waar moet ik rekening mee houden?

Het aanleveren van SMS-berichten via de HTTP-API van MessageBird kan in verschillende charsets.

Als je weet in welke charset je het SMS-bericht aanlevert kun je dit meegeven via de "charset"-parameter. Als je deze parameter niet meegeeft proberen wij automatisch te detecteren in welke charset jouw bericht is opgesteld.

Voor het versturen van SMS-berichten wordt standaard de GSM 03.38-charset gebruikt. Helaas komen veel karakters niet voor in de GSM-charset. Om hiervan zo min mogelijk last te hebben, zetten wij bij via de HTTP-API standaard alle karakters die niet voorkomen in de GSM-charset om naar aanverwante karakters. Zo zetten wij bijvoorbeeld ç om naar c en ® naar R. Dit doen wij bij het bericht en bij de afzender (indien alfanumeriek).

In de HTTP-API documentatie staat beschreven hoe je deze omzetting ook geforceerd uit kunt zetten (replacechars). Wanneer je het vervangen van niet GSM-karakters uit zet en een niet GSM-karakter in het bericht stuurt, wordt het betreffende bericht verstuurd als een unicode SMS. De karakters zijn dan niet meer 7 bits waardoor er niet meer 160 karakters per SMS mogelijk zijn (140 bytes per SMS/7 bit = 160 karakters). Als je een unicode SMS verstuurt, wordt dit altijd als 16 bit karakters verstuurd (140 bytes per SMS/16 bit = 70 karakters). Je kunt dan enkel 70 karakters per SMS versturen.

Als je een connectie op ons platform hebt met SMPP of EMI/UCP worden charsets automatisch correct afgehandeld.