内容目录

音频转换功能使用帮助

音频转换功能使用帮助 #

音频转换功能用于把常见音频文件批量或单个转换成其他音频格式，适合做平台上传适配、语音素材整理、播客压缩、课程音频导出、配音文件转码和不同设备兼容处理。对于经常要在 MP3、WAV、AAC、FLAC、M4A、OGG、OPUS、WMA、AMR、AIFF、AC3 之间切换的用户来说，这是一个非常高频的基础功能。

这个功能当前不只是“改后缀名”，而是会根据目标格式自动选择编码器、采样率、声道和码率参数，并在不兼容时给出自动调整。例如某些格式不支持你手动输入的采样率时，系统会自动改成最接近且真实受支持的值；如果你选择的是无损格式，界面里的码率设置也会自动忽略。

音频转换 1 音频转换功能

功能描述 #

音频转换功能支持两种输入方式：

单个音频文件
音频文件夹批量转换

用户选择输入内容和输出文件夹后，可以设置目标格式、码率、采样率和声道。点击开始后，系统会调用内置 FFmpeg 执行真实转码，并把结果输出到目标目录中。

当前支持的目标格式包括：

mp3
wav
aac
flac
ogg
wma
opus
m4a
amr
aiff
ac3

主要功能 #

支持单个音频文件转换
支持文件夹批量转换
支持多种常见音频格式输出
支持码率设置
支持预设采样率和自定义采样率
支持 kHz / Hz 两种输入写法
支持单声道与立体声选择
支持按目标格式自动修正规格
支持转换完成后打开输出文件夹

功能特点 #

1. 采样率单位更友好 #

当前面板专门把采样率输入设计成兼容 kHz 和 Hz 两种写法，例如：

16 kHz
44.1 kHz
16000 Hz
44100 Hz

这样普通用户不用死记硬背所有数字，也不需要自己先换算后再填写。

2. 不是所有格式都支持所有采样率 #

不同音频格式支持的采样率范围并不一样。当前功能会先按目标格式检查采样率是否合法，如果不支持，不会直接让任务失败，而是自动调整为最接近且真正受支持的采样率，并在界面状态提示里告诉你发生了什么。

3. 无损格式会自动忽略码率 #

WAV、FLAC、AIFF 属于当前界面里的无损方向格式，这些格式更偏固定质量输出，因此码率选项不会像有损格式那样直接决定结果。界面会明确提示这类格式会忽略码率设置。

4. 特殊格式会自动修正声道 #

例如 AMR 当前只支持单声道。如果你手动选了立体声，系统会自动改回单声道，而不是盲目带着不兼容参数继续执行。

软件工作流程对应补充 #

面板层已经内置了几组真实规则：

常用高质量预设采样率
当前格式真实支持的采样率列表
自定义采样率输入解析
不支持时自动就近归一化
无损格式忽略码率
AMR 自动改为单声道

工作线程层则负责：

单文件转换
文件夹批量扫描
为每个输入文件生成对应输出文件
调用内置转换器执行转码
检查输出文件是否生成成功
在状态栏反馈“正在转换”或错误信息

采样率单位说明 #

这是音频转换里最容易让用户混淆的一部分，建议重点看清楚。

`Hz` 是什么 #

Hz 表示赫兹，也就是每秒采样多少次。

例如：

16000 Hz 表示每秒采样 16000 次
44100 Hz 表示每秒采样 44100 次
48000 Hz 表示每秒采样 48000 次

`kHz` 是什么 #

kHz 表示千赫兹，1 kHz = 1000 Hz。

所以：

8 kHz = 8000 Hz
16 kHz = 16000 Hz
44.1 kHz = 44100 Hz
48 kHz = 48000 Hz
96 kHz = 96000 Hz

这两个单位怎么换算 #

最简单的记法就是：

kHz × 1000 = Hz
Hz ÷ 1000 = kHz

例如：

16 kHz × 1000 = 16000 Hz
44100 Hz ÷ 1000 = 44.1 kHz

当前功能支持哪些输入写法 #

按真实面板逻辑，你可以输入：

16 kHz
44.1 kHz
16000 Hz
44100 Hz
48kHz
48000

需要注意的是，如果你直接输入一个小于 1000 的纯数字，例如 16，当前逻辑会把它理解成 16 kHz，也就是自动换算成 16000 Hz。这对语音平台场景非常实用，但也意味着你不要把 16 误以为是 16 Hz。

常见误区 #

16 Hz 几乎不是正常语音采样率，很多用户真正想表达的是 16 kHz
44.1 通常应理解为 44.1 kHz，而不是 44.1 Hz
48000 Hz 和 48 kHz 是同一个意思
44100 Hz 和 44.1 kHz 是同一个意思

当前支持的常见采样率 #

不同格式支持范围不同，下面是当前代码里真实存在的常见采样率方向。

常见推荐值 #

界面当前优先给出的高质量常用预设大致是：

44.1 kHz
48 kHz
部分无损格式还会提供 96 kHz

默认推荐值大多数格式是：

48 kHz

例外格式：

AMR 默认推荐为 8 kHz

格式支持差异 #

当前真实实现里，目标格式对采样率支持大致如下：

MP3：支持从 8 kHz 到 48 kHz
AAC / M4A：支持范围更宽，可到 96 kHz
OGG：常见支持到 48 kHz
OPUS：当前支持 8 / 12 / 16 / 24 / 48 kHz
WMA：常见支持到 48 kHz
AMR：仅支持 8 kHz
AC3：常见支持 32 / 44.1 / 48 kHz
WAV / FLAC / AIFF：预设里提供到 96 kHz

自动调整逻辑说明 #

这是当前功能很实用的一点。

采样率不支持时会怎样 #

如果你输入的采样率不在目标格式支持列表里，系统不会直接按这个值硬转，而是自动改成最接近的受支持值。

例如：

目标格式是 MP3，你输入 64 kHz，系统可能仍会保留，因为当前 MP3 支持 64000 Hz
目标格式是 OPUS，你输入 44.1 kHz，系统会自动改成最接近的 48 kHz
目标格式是 AMR，你输入 16 kHz，系统会自动改成 8 kHz

界面状态栏会给出类似提示：

目标格式不支持 44.1 kHz (44100 Hz)，系统会自动调整为最接近且受支持的 48 kHz (48000 Hz)

声道不支持时会怎样 #

如果目标格式是 AMR，但你选了立体声，系统会自动改成：

1 (单声道)

无损格式为什么忽略码率 #

因为在当前实现里：

WAV
FLAC
AIFF

被当作无损格式处理。转换时不会再追加类似 128k / 192k / 320k 这种有损码率参数，所以界面会直接提示你码率设置将被忽略。

主要参数说明 #

目标格式 #

决定最终输出文件类型。建议先按用途选格式，再调采样率和码率。

常见理解可以这样记：

MP3：兼容性高，分发常用
AAC / M4A：常见平台和移动端友好
WAV / FLAC / AIFF：更适合保真或后期处理
OPUS / OGG：更适合部分现代压缩场景
AMR：更偏语音、低带宽和兼容旧场景
AC3：更偏视频配套音频或家庭影院方向

码率 #

单位是 kbps，例如：

64 kbps
128 kbps
192 kbps
256 kbps
320 kbps

它和采样率不是一回事。

码率更偏向压缩后每秒保留多少数据
采样率更偏向每秒采样多少次

很多用户会把 16 kHz 和 128 kbps 混为一谈，这两个单位完全不是一个概念。

采样率 #

当前可以选择预设，也可以用“自定义”手动输入。

推荐理解方式：

语音平台常见：16 kHz
常见音乐 / 通用音频：44.1 kHz
视频配套 / 较高通用标准：48 kHz
更高保真场景：96 kHz

声道 #

支持：

1 (单声道)
2 (立体声)

如果只是语音识别、电话语音或轻量语音平台，单声道往往就够用；如果是音乐、环境声或更完整的播放体验，通常更适合立体声。

使用流程 #

第一步：选择输入内容 #

可以选择：

单个音频文件
包含多个音频文件的文件夹

第二步：选择输出文件夹 #

建议单独建立输出目录，便于区分不同格式的结果。

第三步：选择目标格式 #

先确定你最终要什么格式，例如 mp3、wav、aac、flac。

第四步：设置码率、采样率和声道 #

按用途调整：

有损格式：重点看码率和采样率
无损格式：更关注采样率和声道
语音场景：优先看 16 kHz / 单声道
通用高质量场景：优先看 44.1 kHz 或 48 kHz

第五步：开始转换 #

点击“开始转换”后，按钮会切换到进行中状态，状态栏也会显示当前转换信息或自动调整说明。

第六步：检查输出结果 #

建议重点检查：

文件能否正常播放
采样率是否符合目标平台要求
声道是否正确
有损格式的体积和听感是否平衡

使用建议 #

如果你不确定平台要求，优先用 44.1 kHz 或 48 kHz
如果平台明确写“16k”，通常指的是 16 kHz，也就是 16000 Hz
做语音平台上传时，建议重点区分 16 kHz 和 16 Hz
如果你输入了一个非常规值，先看状态提示，确认系统有没有自动调整
无损格式不要纠结 128 kbps / 192 kbps 这类码率选项，因为当前实现会忽略它
批量转换前建议先拿一个样本测试，确认格式和采样率都满足要求再整批执行

适用场景 #

音频上传前格式适配
语音平台要求 16 kHz 的场景
课程音频统一转码
播客音频整理
视频配套音频格式调整
大量音频文件批量转换

常见问题 #

`16` 到底是 `16 Hz` 还是 `16 kHz`？ #

按当前功能的真实逻辑，如果你在自定义采样率里直接输入 16，系统会把它按 16 kHz 处理，也就是换算成 16000 Hz。这正是为了照顾语音平台常见写法。

`44.1 kHz` 和 `44100 Hz` 有区别吗？ #

没有，本质是同一个采样率，只是写法不同。

为什么我输入一个值后，最后输出成了别的采样率？ #

因为目标格式未必支持你输入的值。当前系统会自动改成最接近且实际支持的采样率，并在状态提示里说明原因。

为什么选了 `WAV` 以后码率没意义？ #

因为 WAV、FLAC、AIFF 在当前实现里按无损格式处理，码率设置会被自动忽略。

为什么 `AMR` 会自动变成单声道？ #

因为当前实现里 AMR 只支持单声道，所以系统会自动调整，避免生成不兼容结果。

总结 #

音频转换功能当前已经把“格式切换”“采样率单位换算”“格式兼容限制”“自动纠正参数”这些实际最容易出错的地方都考虑进去了。特别是 Hz 和 kHz 的换算、低采样率语音场景的输入习惯、以及格式不兼容时的自动就近调整，这些都非常适合写进帮助中心，方便普通用户少踩坑，也方便进阶用户按真实实现设置参数。