Depende de cómo usted escribe los datos al archivo y a su requisito.
Para las codificaciones estándar ASCII y UT8 (que cubrirán inglés y similar otros charsets), la longitud de la secuencia y la longitud del octeto del archivo emparejarán, como un carácter toma solamente octeto en archivo.
Para las codificaciones de Unicode (como carbones de leña japoneses), como usted dijo que longitud de la longitud de la secuencia y del octeto del archivo no emparejará pues un carácter tomará dos octetos.
Debajo está el código para ambas las codificaciones, usted puede utilizar según su requisito.