View Categories

音频转换功能

音频转换功能使用帮助 #

音频转换功能用于把常见音频文件批量或单个转换成其他音频格式,适合做平台上传适配、语音素材整理、播客压缩、课程音频导出、配音文件转码和不同设备兼容处理。对于经常要在 MP3WAVAACFLACM4AOGGOPUSWMAAMRAIFFAC3 之间切换的用户来说,这是一个非常高频的基础功能。

这个功能当前不只是“改后缀名”,而是会根据目标格式自动选择编码器、采样率、声道和码率参数,并在不兼容时给出自动调整。例如某些格式不支持你手动输入的采样率时,系统会自动改成最接近且真实受支持的值;如果你选择的是无损格式,界面里的码率设置也会自动忽略。

音频转换 1 音频转换功能

功能描述 #

音频转换功能支持两种输入方式:

  • 单个音频文件
  • 音频文件夹批量转换

用户选择输入内容和输出文件夹后,可以设置目标格式、码率、采样率和声道。点击开始后,系统会调用内置 FFmpeg 执行真实转码,并把结果输出到目标目录中。

当前支持的目标格式包括:

  • mp3
  • wav
  • aac
  • flac
  • ogg
  • wma
  • opus
  • m4a
  • amr
  • aiff
  • ac3

主要功能 #

  • 支持单个音频文件转换
  • 支持文件夹批量转换
  • 支持多种常见音频格式输出
  • 支持码率设置
  • 支持预设采样率和自定义采样率
  • 支持 kHz / Hz 两种输入写法
  • 支持单声道与立体声选择
  • 支持按目标格式自动修正规格
  • 支持转换完成后打开输出文件夹

功能特点 #

1. 采样率单位更友好 #

当前面板专门把采样率输入设计成兼容 kHz 和 Hz 两种写法,例如:

  • 16 kHz
  • 44.1 kHz
  • 16000 Hz
  • 44100 Hz

这样普通用户不用死记硬背所有数字,也不需要自己先换算后再填写。

2. 不是所有格式都支持所有采样率 #

不同音频格式支持的采样率范围并不一样。当前功能会先按目标格式检查采样率是否合法,如果不支持,不会直接让任务失败,而是自动调整为最接近且真正受支持的采样率,并在界面状态提示里告诉你发生了什么。

3. 无损格式会自动忽略码率 #

WAVFLACAIFF 属于当前界面里的无损方向格式,这些格式更偏固定质量输出,因此码率选项不会像有损格式那样直接决定结果。界面会明确提示这类格式会忽略码率设置。

4. 特殊格式会自动修正声道 #

例如 AMR 当前只支持单声道。如果你手动选了立体声,系统会自动改回单声道,而不是盲目带着不兼容参数继续执行。

软件工作流程对应补充 #

面板层已经内置了几组真实规则:

  • 常用高质量预设采样率
  • 当前格式真实支持的采样率列表
  • 自定义采样率输入解析
  • 不支持时自动就近归一化
  • 无损格式忽略码率
  • AMR 自动改为单声道

工作线程层则负责:

  • 单文件转换
  • 文件夹批量扫描
  • 为每个输入文件生成对应输出文件
  • 调用内置转换器执行转码
  • 检查输出文件是否生成成功
  • 在状态栏反馈“正在转换”或错误信息

采样率单位说明 #

这是音频转换里最容易让用户混淆的一部分,建议重点看清楚。

Hz 是什么 #

Hz 表示赫兹,也就是每秒采样多少次。

例如:

  • 16000 Hz 表示每秒采样 16000 次
  • 44100 Hz 表示每秒采样 44100 次
  • 48000 Hz 表示每秒采样 48000 次

kHz 是什么 #

kHz 表示千赫兹,1 kHz = 1000 Hz

所以:

  • 8 kHz = 8000 Hz
  • 16 kHz = 16000 Hz
  • 44.1 kHz = 44100 Hz
  • 48 kHz = 48000 Hz
  • 96 kHz = 96000 Hz

这两个单位怎么换算 #

最简单的记法就是:

  • kHz × 1000 = Hz
  • Hz ÷ 1000 = kHz

例如:

  • 16 kHz × 1000 = 16000 Hz
  • 44100 Hz ÷ 1000 = 44.1 kHz

当前功能支持哪些输入写法 #

按真实面板逻辑,你可以输入:

  • 16 kHz
  • 44.1 kHz
  • 16000 Hz
  • 44100 Hz
  • 48kHz
  • 48000

需要注意的是,如果你直接输入一个小于 1000 的纯数字,例如 16,当前逻辑会把它理解成 16 kHz,也就是自动换算成 16000 Hz。这对语音平台场景非常实用,但也意味着你不要把 16 误以为是 16 Hz

常见误区 #

  • 16 Hz 几乎不是正常语音采样率,很多用户真正想表达的是 16 kHz
  • 44.1 通常应理解为 44.1 kHz,而不是 44.1 Hz
  • 48000 Hz 和 48 kHz 是同一个意思
  • 44100 Hz 和 44.1 kHz 是同一个意思

当前支持的常见采样率 #

不同格式支持范围不同,下面是当前代码里真实存在的常见采样率方向。

常见推荐值 #

界面当前优先给出的高质量常用预设大致是:

  • 44.1 kHz
  • 48 kHz
  • 部分无损格式还会提供 96 kHz

默认推荐值大多数格式是:

  • 48 kHz

例外格式:

  • AMR 默认推荐为 8 kHz

格式支持差异 #

当前真实实现里,目标格式对采样率支持大致如下:

  • MP3:支持从 8 kHz 到 48 kHz
  • AAC / M4A:支持范围更宽,可到 96 kHz
  • OGG:常见支持到 48 kHz
  • OPUS:当前支持 8 / 12 / 16 / 24 / 48 kHz
  • WMA:常见支持到 48 kHz
  • AMR:仅支持 8 kHz
  • AC3:常见支持 32 / 44.1 / 48 kHz
  • WAV / FLAC / AIFF:预设里提供到 96 kHz

自动调整逻辑说明 #

这是当前功能很实用的一点。

采样率不支持时会怎样 #

如果你输入的采样率不在目标格式支持列表里,系统不会直接按这个值硬转,而是自动改成最接近的受支持值。

例如:

  • 目标格式是 MP3,你输入 64 kHz,系统可能仍会保留,因为当前 MP3 支持 64000 Hz
  • 目标格式是 OPUS,你输入 44.1 kHz,系统会自动改成最接近的 48 kHz
  • 目标格式是 AMR,你输入 16 kHz,系统会自动改成 8 kHz

界面状态栏会给出类似提示:

目标格式不支持 44.1 kHz (44100 Hz),系统会自动调整为最接近且受支持的 48 kHz (48000 Hz)

声道不支持时会怎样 #

如果目标格式是 AMR,但你选了立体声,系统会自动改成:

  • 1 (单声道)

无损格式为什么忽略码率 #

因为在当前实现里:

  • WAV
  • FLAC
  • AIFF

被当作无损格式处理。转换时不会再追加类似 128k / 192k / 320k 这种有损码率参数,所以界面会直接提示你码率设置将被忽略。

主要参数说明 #

目标格式 #

决定最终输出文件类型。建议先按用途选格式,再调采样率和码率。

常见理解可以这样记:

  • MP3:兼容性高,分发常用
  • AAC / M4A:常见平台和移动端友好
  • WAV / FLAC / AIFF:更适合保真或后期处理
  • OPUS / OGG:更适合部分现代压缩场景
  • AMR:更偏语音、低带宽和兼容旧场景
  • AC3:更偏视频配套音频或家庭影院方向

码率 #

单位是 kbps,例如:

  • 64 kbps
  • 128 kbps
  • 192 kbps
  • 256 kbps
  • 320 kbps

它和采样率不是一回事。

  • 码率更偏向压缩后每秒保留多少数据
  • 采样率更偏向每秒采样多少次

很多用户会把 16 kHz 和 128 kbps 混为一谈,这两个单位完全不是一个概念。

采样率 #

当前可以选择预设,也可以用“自定义”手动输入。

推荐理解方式:

  • 语音平台常见:16 kHz
  • 常见音乐 / 通用音频:44.1 kHz
  • 视频配套 / 较高通用标准:48 kHz
  • 更高保真场景:96 kHz

声道 #

支持:

  • 1 (单声道)
  • 2 (立体声)

如果只是语音识别、电话语音或轻量语音平台,单声道往往就够用;如果是音乐、环境声或更完整的播放体验,通常更适合立体声。

使用流程 #

第一步:选择输入内容 #

可以选择:

  • 单个音频文件
  • 包含多个音频文件的文件夹

第二步:选择输出文件夹 #

建议单独建立输出目录,便于区分不同格式的结果。

第三步:选择目标格式 #

先确定你最终要什么格式,例如 mp3wavaacflac

第四步:设置码率、采样率和声道 #

按用途调整:

  • 有损格式:重点看码率和采样率
  • 无损格式:更关注采样率和声道
  • 语音场景:优先看 16 kHz / 单声道
  • 通用高质量场景:优先看 44.1 kHz 或 48 kHz

第五步:开始转换 #

点击“开始转换”后,按钮会切换到进行中状态,状态栏也会显示当前转换信息或自动调整说明。

第六步:检查输出结果 #

建议重点检查:

  • 文件能否正常播放
  • 采样率是否符合目标平台要求
  • 声道是否正确
  • 有损格式的体积和听感是否平衡

使用建议 #

  • 如果你不确定平台要求,优先用 44.1 kHz 或 48 kHz
  • 如果平台明确写“16k”,通常指的是 16 kHz,也就是 16000 Hz
  • 做语音平台上传时,建议重点区分 16 kHz 和 16 Hz
  • 如果你输入了一个非常规值,先看状态提示,确认系统有没有自动调整
  • 无损格式不要纠结 128 kbps / 192 kbps 这类码率选项,因为当前实现会忽略它
  • 批量转换前建议先拿一个样本测试,确认格式和采样率都满足要求再整批执行

适用场景 #

  • 音频上传前格式适配
  • 语音平台要求 16 kHz 的场景
  • 课程音频统一转码
  • 播客音频整理
  • 视频配套音频格式调整
  • 大量音频文件批量转换

常见问题 #

16 到底是 16 Hz 还是 16 kHz#

按当前功能的真实逻辑,如果你在自定义采样率里直接输入 16,系统会把它按 16 kHz 处理,也就是换算成 16000 Hz。这正是为了照顾语音平台常见写法。

44.1 kHz 和 44100 Hz 有区别吗? #

没有,本质是同一个采样率,只是写法不同。

为什么我输入一个值后,最后输出成了别的采样率? #

因为目标格式未必支持你输入的值。当前系统会自动改成最接近且实际支持的采样率,并在状态提示里说明原因。

为什么选了 WAV 以后码率没意义? #

因为 WAVFLACAIFF 在当前实现里按无损格式处理,码率设置会被自动忽略。

为什么 AMR 会自动变成单声道? #

因为当前实现里 AMR 只支持单声道,所以系统会自动调整,避免生成不兼容结果。

总结 #

音频转换功能当前已经把“格式切换”“采样率单位换算”“格式兼容限制”“自动纠正参数”这些实际最容易出错的地方都考虑进去了。特别是 Hz 和 kHz 的换算、低采样率语音场景的输入习惯、以及格式不兼容时的自动就近调整,这些都非常适合写进帮助中心,方便普通用户少踩坑,也方便进阶用户按真实实现设置参数。