WAVE头分析代码

转载:


这篇文章是网络上流行的比较广泛的针对WAVE头分析的文章, 整体写的简单明了非常好,但是

18H

2

int

采样率(每秒样本数),表示每个通道的播放速度,

应该是不对的, 如果按这个该文章的计算,WAVE头只有42byte, 实际上wave头是44byte.

参考MS的标准文档知道这个采样率是占4byte的.(见 WAVE PCM soundfile format )

 

 

// ----------------------------------------------------------------

WAVE文件格式剖析

 WAVE 文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是"RIFF"。WAVE文件由文件头和数据体两大部分组成。其中文件头又分为RIFF/WAV文件 标识段和声音数据格式说明段两部分。WAVE文件各部分内容及格式见附表。[!21ki@][@21ki!]
常 见的声音文件主要有两种,分别对应于单声道(11.025KHz 采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信号在"模→数"转换过程中单位时间内采样的次数。 采样值是指每一次采样周期内声音模拟信号的积分值。[!21ki@][@21ki!]
对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。[!21ki@][@21ki!]
        WAVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAVE文件是由样本组织而成的。在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。在多声道WAVE文件中,样本是交替出现的。

  WAVE文件格式说明表  [!21ki@][@21ki!]

 

偏移地址

字节数

数据类型

内   容

 

文件头[!21ki@][@21ki!]

00H

4

char

"RIFF"标志

04H

4

long int

文件长度

08H

4

char

"WAVE"标志

0CH

4

char

"fmt"标志

10H

4

 

过渡字节(不定)

14H

2

int

格式类别(10H为PCM形式的声音数据)

16H

2

int

通道数,单声道为1,双声道为2

18H

2

int

采样率(每秒样本数),表示每个通道的播放速度,

1CH

4

long int

波形音频数据传送速率,其值为通道数×每秒数据位数×每样本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。

20H

2

int

数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。

22H

2

 

每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言,样本大小都一样。

24H

4

char

数据标记符"data"

28H

4

long int

语音数据的长度

  PCM数据的存放方式: [!21ki@][@21ki!]

 

样本1

样本2

8位单声道

0声道

0声道

8位立体声

0声道(左)

1声道(右)

0声道(左)

1声道(右)

16位单声道

0声道低字节

0声道高字节

0声道低字节

0声道高字节

16位立体声

0声道(左)低字节

0声道(左)高字节

1声道(右)低字节

1声道(右)高字节

 WAVE文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需的最小字节数。首先存储低有效字节,表示样本幅度的位放在i的高有效位上,剩下的位置为0,这样8位和16位的PCM波形样本的数据格式如下所示。  [!21ki@][@21ki!]

样本大小

数据格式

最大值

最小值

8位PCM

unsigned int

225

0

16位PCM

int

32767

-32767

 

 

 

 

 

 

 

 

分析WAVE头的代码

/*

                     WAVE文件头(PCM格式)

                    

field         size   type       description

-----------------------------------------------------------------------

ChunkID       4      char       "RIFF"标志

 

ChunkSize     4      long int   文件长度(WAVE文件的大小, 不含前8个字节)

 

Format        4      char       "WAVE"标志

 

SubChunk1ID   4      char       "fmt "标志

 

SubChunk1Size 4                 过渡字节(不定)

 

AudioFormat   2      short int  格式类别(1为PCM格式的声音数据)

 

NumChannels   2      short int  通道数(单声道为1, 双声道为2)

 

SampleRate    4      long int   采样率(每秒样本数), 表示每个通道的播放速度

                                一般情况是每秒采样44100次

                               

ByteRate      4      long int   波形音频数据传输速率, 其值为:通道数*每秒数据位数*每样本的数据位数/8

                                播放软件可以利用该值估计缓冲区大小

                                2 *

 

BlockAlign    2      short int  每样本的数据位数(按字节算), 其值为:通道数*每样本的数据位值/8, 播放

软件需要一次处理多个该值大小的字节数据, 以便将其值用于缓冲区的调整

                                每样本占几个字节 : NumChannels * 16/8

                               

BitsPerSample 2                 每样本的数据位数, 表示每个声道中各个样本的数据位数. 如果有多个声道,

                                对每个声道而言, 样本大小都一样

                                就是分辨率, 一般是16位, 8位也有但是要少一些.

                               

SubChunk2ID       4      char   数据标记"data"

 

SubChunk2Size 4      long int   语音数据的长度

*/

 

 

#include <stdlib.h>

#include <stdio.h>

#include <string.h>

#include <mem.h>

 

 

/* WAVE文件头 */

typedef struct wave_tag

{

    char              ChunkID[5];       // "RIFF"标志

    unsigned long int ChunkSize;    // 文件长度(WAVE文件的大小, 不含前8个字节)

    char              Format[5];    // "WAVE"标志

   

    char             SubChunk1ID[5];   // "fmt "标志

    unsigned long int SubChunk1Size;    /*

                                    * 过渡字节(不定)

                                    * 16 for PCM. This is the size of the rest of the

                                    * Subchunk which follows this number.

                                    */

    unsigned short int   AudioFormat;  /*

                                    * 格式类别(10H为PCM格式的声音数据)

                                    * PCM=1 (i.e. Linear quantization)

                                    * Values other than 1 indicate some form of compression.

                                    */

    unsigned short int   NumChannels;  // 通道数(单声道为1, 双声道为2)

    //unsigned short int SampleRate;       // 采样率(每秒样本数), 表示每个通道的播放速度

    unsigned long int    SampleRate;       // 采样率(每秒样本数), 表示每个通道的播放速度

    unsigned long int ByteRate;     /*

                                     * 波形音频数据传输速率, 其值为:通道数*每秒数据位数*每样本的数据位数/8

                                     * 播放软件可以利用该值估计缓冲区大小

                                     */

    unsigned short int   BlockAlign;       /*

                                      * 每样本的数据位数(按字节算), 其值为:通道数*每样本的数据位值/8, 播放

                                     * 软件需要一次处理多个该值大小的字节数据, 以便将其值用于缓冲区的调整

                                     */

    unsigned short int   BitsPerSample;    /*

                                    * 每样本的数据位数, 表示每个声道中各个样本的数据位数. 如果有多个声道,

                                    * 对每个声道而言, 样本大小都一样

                                    */

   

    char              SubChunk2ID[5];   // 数据标记"data"

    unsigned long int SubChunk2Size;    // 语音数据的长度

} WAVE;

 

 

/* 分辨率为16的样本 */

typedef struct swatch16_tag

{

     char swing;

     

} swatch16;

 

/* 分辨率为8的样本 */

typedef struct swatch8_tag

{

   

} swatch8;

 

 

 

 

// 爱情复兴 :), 长度: 41.5MB(43,554,860 字节)

#define    FILE_PATH  "aiqingfuxing1.wav"

 

 

 

/*

 * 分析音频文件格式

 */

int

main ( void )

{

    FILE   *stream;

    WAVE   wav;

   

    stream = fopen( FILE_PATH, "r" );  /* open a file for reading */

   

    /*

     * 读wav文件的各个field

     */

    fread(wav.ChunkID,          4, 1, stream);

    wav.ChunkID[4] = (char)0;

    fread(&(wav.ChunkSize),     4, 1, stream);

    fread(wav.Format,           4, 1, stream);

    wav.Format[4] = (char)0;

    fread(wav.SubChunk1ID,      4, 1, stream);                                                                                          

    wav.SubChunk1ID[4] = (char)0;

    fread(&(wav.SubChunk1Size), 4, 1, stream);

    fread(&(wav.AudioFormat),   2, 1, stream);

    fread(&(wav.NumChannels),   2, 1, stream);

    fread(&(wav.SampleRate), 4, 1, stream);

    fread(&(wav.ByteRate),      4, 1, stream);

    fread(&(wav.BlockAlign), 2, 1, stream);

    fread(&(wav.BitsPerSample), 2, 1, stream);

    fread(wav.SubChunk2ID,      4, 1, stream);

    wav.SubChunk2ID[4] = (char)0;

    fread(&(wav.SubChunk2Size), 4, 1, stream);

   

    printf("ChunkID---->%s/n",         wav.ChunkID);

    printf("ChunkSize---->%ld/n",      wav.ChunkSize);

    printf("Format---->%s/n",          wav.Format);

    printf("SubChunk1ID---->%s/n",     wav.SubChunk1ID);

    printf("SubChunk1Size---->%ld/n", wav.SubChunk1Size);

    printf("AudioFormat---->%d/n",     wav.AudioFormat);

    printf("NumChannels---->%d/n",     wav.NumChannels);

    printf("SampleRate---->%ld/n",     wav.SampleRate);

    printf("ByteRate---->%ld/n",       wav.ByteRate);

    printf("BlockAlign---->%d/n",      wav.BlockAlign);

    printf("BitsPerSample---->%d/n",   wav.BitsPerSample);

    printf("SubChunk2ID---->%s/n",     wav.SubChunk2ID);

    printf("SubChunk2Size---->%ld/n", wav.SubChunk2Size);

   

    printf("*************rrr**********/n");   //

   

   

    system( "pause" );

    return 0;

}

 

/*

              打印结果

ChunkID---->RIFF

ChunkSize---->43554852

Format---->WAVE

SubChunk1ID---->fmt

SubChunk1Size---->16

AudioFormat---->1

NumChannels---->2

SampleRate---->44100

ByteRate---->176400

BlockAlign---->4

BitsPerSample---->16

SubChunk2ID---->data

SubChunk2Size---->43554816

*************rrr**********

请按任意键继续. . .

*/

 

/*

                  WAVE头的16进制码

52 49 46 46 C4 86 01 00 57 41 56 45 66 6D 74 20

10 00 00 00 01 00 02 00 44 AC 00 00 10 B1 02 00

04 00 10 00 64 61 74 61 A0 86 01 00 D7 FA DA FE

 

52 49 46 46          ChunkID           "RIFF"

C4 86 01 00          ChunkSize      

57 41 56 45           Format            "WAVE"

66 6D 74 20          SubChunk1ID       "fmt "

10 00 00 00          SubChunk1Size

01 00                 AudioFormat

02 00                 NumChannels

44 AC 00 00          SampleRate

10 B1 02 00          ByteRate

04 00                 BlockAlign

10 00                 BitsPerSample

64 61 74 61          SubChunk2ID

A0 86 01 00          SubChunk2Size

*/

WAVE头分析代码

转载:


这篇文章是网络上流行的比较广泛的针对WAVE头分析的文章, 整体写的简单明了非常好,但是

18H

2

int

采样率(每秒样本数),表示每个通道的播放速度,

应该是不对的, 如果按这个该文章的计算,WAVE头只有42byte, 实际上wave头是44byte.

参考MS的标准文档知道这个采样率是占4byte的.(见 WAVE PCM soundfile format )

 

 

// ----------------------------------------------------------------

WAVE文件格式剖析

 WAVE 文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是"RIFF"。WAVE文件由文件头和数据体两大部分组成。其中文件头又分为RIFF/WAV文件 标识段和声音数据格式说明段两部分。WAVE文件各部分内容及格式见附表。[!21ki@][@21ki!]
常 见的声音文件主要有两种,分别对应于单声道(11.025KHz 采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信号在"模→数"转换过程中单位时间内采样的次数。 采样值是指每一次采样周期内声音模拟信号的积分值。[!21ki@][@21ki!]
对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。[!21ki@][@21ki!]
        WAVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAVE文件是由样本组织而成的。在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。在多声道WAVE文件中,样本是交替出现的。

  WAVE文件格式说明表  [!21ki@][@21ki!]

 

偏移地址

字节数

数据类型

内   容

 

文件头[!21ki@][@21ki!]

00H

4

char

"RIFF"标志

04H

4

long int

文件长度

08H

4

char

"WAVE"标志

0CH

4

char

"fmt"标志

10H

4

 

过渡字节(不定)

14H

2

int

格式类别(10H为PCM形式的声音数据)

16H

2

int

通道数,单声道为1,双声道为2

18H

2

int

采样率(每秒样本数),表示每个通道的播放速度,

1CH

4

long int

波形音频数据传送速率,其值为通道数×每秒数据位数×每样本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。

20H

2

int

数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。

22H

2

 

每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言,样本大小都一样。

24H

4

char

数据标记符"data"

28H

4

long int

语音数据的长度

  PCM数据的存放方式: [!21ki@][@21ki!]

 

样本1

样本2

8位单声道

0声道

0声道

8位立体声

0声道(左)

1声道(右)

0声道(左)

1声道(右)

16位单声道

0声道低字节

0声道高字节

0声道低字节

0声道高字节

16位立体声

0声道(左)低字节

0声道(左)高字节

1声道(右)低字节

1声道(右)高字节

 WAVE文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需的最小字节数。首先存储低有效字节,表示样本幅度的位放在i的高有效位上,剩下的位置为0,这样8位和16位的PCM波形样本的数据格式如下所示。  [!21ki@][@21ki!]

样本大小

数据格式

最大值

最小值

8位PCM

unsigned int

225

0

16位PCM

int

32767

-32767

 

 

 

 

 

 

 

 

分析WAVE头的代码

/*

                     WAVE文件头(PCM格式)

                    

field         size   type       description

-----------------------------------------------------------------------

ChunkID       4      char       "RIFF"标志

 

ChunkSize     4      long int   文件长度(WAVE文件的大小, 不含前8个字节)

 

Format        4      char       "WAVE"标志

 

SubChunk1ID   4      char       "fmt "标志

 

SubChunk1Size 4                 过渡字节(不定)

 

AudioFormat   2      short int  格式类别(1为PCM格式的声音数据)

 

NumChannels   2      short int  通道数(单声道为1, 双声道为2)

 

SampleRate    4      long int   采样率(每秒样本数), 表示每个通道的播放速度

                                一般情况是每秒采样44100次

                               

ByteRate      4      long int   波形音频数据传输速率, 其值为:通道数*每秒数据位数*每样本的数据位数/8

                                播放软件可以利用该值估计缓冲区大小

                                2 *

 

BlockAlign    2      short int  每样本的数据位数(按字节算), 其值为:通道数*每样本的数据位值/8, 播放

软件需要一次处理多个该值大小的字节数据, 以便将其值用于缓冲区的调整

                                每样本占几个字节 : NumChannels * 16/8

                               

BitsPerSample 2                 每样本的数据位数, 表示每个声道中各个样本的数据位数. 如果有多个声道,

                                对每个声道而言, 样本大小都一样

                                就是分辨率, 一般是16位, 8位也有但是要少一些.

                               

SubChunk2ID       4      char   数据标记"data"

 

SubChunk2Size 4      long int   语音数据的长度

*/

 

 

#include <stdlib.h>

#include <stdio.h>

#include <string.h>

#include <mem.h>

 

 

/* WAVE文件头 */

typedef struct wave_tag

{

    char              ChunkID[5];       // "RIFF"标志

    unsigned long int ChunkSize;    // 文件长度(WAVE文件的大小, 不含前8个字节)

    char              Format[5];    // "WAVE"标志

   

    char             SubChunk1ID[5];   // "fmt "标志

    unsigned long int SubChunk1Size;    /*

                                    * 过渡字节(不定)

                                    * 16 for PCM. This is the size of the rest of the

                                    * Subchunk which follows this number.

                                    */

    unsigned short int   AudioFormat;  /*

                                    * 格式类别(10H为PCM格式的声音数据)

                                    * PCM=1 (i.e. Linear quantization)

                                    * Values other than 1 indicate some form of compression.

                                    */

    unsigned short int   NumChannels;  // 通道数(单声道为1, 双声道为2)

    //unsigned short int SampleRate;       // 采样率(每秒样本数), 表示每个通道的播放速度

    unsigned long int    SampleRate;       // 采样率(每秒样本数), 表示每个通道的播放速度

    unsigned long int ByteRate;     /*

                                     * 波形音频数据传输速率, 其值为:通道数*每秒数据位数*每样本的数据位数/8

                                     * 播放软件可以利用该值估计缓冲区大小

                                     */

    unsigned short int   BlockAlign;       /*

                                      * 每样本的数据位数(按字节算), 其值为:通道数*每样本的数据位值/8, 播放

                                     * 软件需要一次处理多个该值大小的字节数据, 以便将其值用于缓冲区的调整

                                     */

    unsigned short int   BitsPerSample;    /*

                                    * 每样本的数据位数, 表示每个声道中各个样本的数据位数. 如果有多个声道,

                                    * 对每个声道而言, 样本大小都一样

                                    */

   

    char              SubChunk2ID[5];   // 数据标记"data"

    unsigned long int SubChunk2Size;    // 语音数据的长度

} WAVE;

 

 

/* 分辨率为16的样本 */

typedef struct swatch16_tag

{

     char swing;

     

} swatch16;

 

/* 分辨率为8的样本 */

typedef struct swatch8_tag

{

   

} swatch8;

 

 

 

 

// 爱情复兴 :), 长度: 41.5MB(43,554,860 字节)

#define    FILE_PATH  "aiqingfuxing1.wav"

 

 

 

/*

 * 分析音频文件格式

 */

int

main ( void )

{

    FILE   *stream;

    WAVE   wav;

   

    stream = fopen( FILE_PATH, "r" );  /* open a file for reading */

   

    /*

     * 读wav文件的各个field

     */

    fread(wav.ChunkID,          4, 1, stream);

    wav.ChunkID[4] = (char)0;

    fread(&(wav.ChunkSize),     4, 1, stream);

    fread(wav.Format,           4, 1, stream);

    wav.Format[4] = (char)0;

    fread(wav.SubChunk1ID,      4, 1, stream);                                                                                          

    wav.SubChunk1ID[4] = (char)0;

    fread(&(wav.SubChunk1Size), 4, 1, stream);

    fread(&(wav.AudioFormat),   2, 1, stream);

    fread(&(wav.NumChannels),   2, 1, stream);

    fread(&(wav.SampleRate), 4, 1, stream);

    fread(&(wav.ByteRate),      4, 1, stream);

    fread(&(wav.BlockAlign), 2, 1, stream);

    fread(&(wav.BitsPerSample), 2, 1, stream);

    fread(wav.SubChunk2ID,      4, 1, stream);

    wav.SubChunk2ID[4] = (char)0;

    fread(&(wav.SubChunk2Size), 4, 1, stream);

   

    printf("ChunkID---->%s/n",         wav.ChunkID);

    printf("ChunkSize---->%ld/n",      wav.ChunkSize);

    printf("Format---->%s/n",          wav.Format);

    printf("SubChunk1ID---->%s/n",     wav.SubChunk1ID);

    printf("SubChunk1Size---->%ld/n", wav.SubChunk1Size);

    printf("AudioFormat---->%d/n",     wav.AudioFormat);

    printf("NumChannels---->%d/n",     wav.NumChannels);

    printf("SampleRate---->%ld/n",     wav.SampleRate);

    printf("ByteRate---->%ld/n",       wav.ByteRate);

    printf("BlockAlign---->%d/n",      wav.BlockAlign);

    printf("BitsPerSample---->%d/n",   wav.BitsPerSample);

    printf("SubChunk2ID---->%s/n",     wav.SubChunk2ID);

    printf("SubChunk2Size---->%ld/n", wav.SubChunk2Size);

   

    printf("*************rrr**********/n");   //

   

   

    system( "pause" );

    return 0;

}

 

/*

              打印结果

ChunkID---->RIFF

ChunkSize---->43554852

Format---->WAVE

SubChunk1ID---->fmt

SubChunk1Size---->16

AudioFormat---->1

NumChannels---->2

SampleRate---->44100

ByteRate---->176400

BlockAlign---->4

BitsPerSample---->16

SubChunk2ID---->data

SubChunk2Size---->43554816

*************rrr**********

请按任意键继续. . .

*/

 

/*

                  WAVE头的16进制码

52 49 46 46 C4 86 01 00 57 41 56 45 66 6D 74 20

10 00 00 00 01 00 02 00 44 AC 00 00 10 B1 02 00

04 00 10 00 64 61 74 61 A0 86 01 00 D7 FA DA FE

 

52 49 46 46          ChunkID           "RIFF"

C4 86 01 00          ChunkSize      

57 41 56 45           Format            "WAVE"

66 6D 74 20          SubChunk1ID       "fmt "

10 00 00 00          SubChunk1Size

01 00                 AudioFormat

02 00                 NumChannels

44 AC 00 00          SampleRate

10 B1 02 00          ByteRate

04 00                 BlockAlign

10 00                 BitsPerSample

64 61 74 61          SubChunk2ID

A0 86 01 00          SubChunk2Size

*/