You need to enable JavaScript to run this app.
导航
接口说明
最近更新时间:2024.05.28 11:17:38首次发布时间:2021.08.23 16:15:12

接入必读

请先查看接入必读了解具体接入方式,再参考此文档完成接入。

功能介绍

BeatTracking 为用户提供节拍检测能力,自动分析获取音乐的节拍点,发现音乐的更多信息,辅助音乐资源利用。

  • 输入:音乐片段
  • 输出:节拍检测的结果

接口说明

  • 当前支持通过 HTTP 协议在线调用
  • 请求内容包括:
    • payload字段为将请求参数序列化后的json文本
    • data字段为将音频二进制文件按照base64格式编码(标准base64,RFC 4648)的文本
  • 使用备注
注意项说明
功能限制说明需输入音乐类音频,否则返回空Beat错误
输入音频格式限制wav、mp3、aac、m4a等常见格式
音频编码建议采样率大于等于44.1kHz,否则将进行自动转码,可能带来效果损失和更多耗时处理
音频时长限制小于等于10分钟;建议大于5s,否则会影响算法效果
音频大小限制小于等于100MB
输出结果格式json字符串格式,详情请参考响应格式

公共参数

参考详细说明功能调用-通用协议

配置参数

payload配置参数为json字符串格式

字段描述类型是否必传默认值
url服务请求数据的url,若data字段为空,则使用该url下载音频数据。详见功能调用-通用协议-payload.urlstring-
audio_info音频参数,便于服务节省音频解码耗时object-
audio_info.format音频编码格式,wav/mp3/aacstring-
audio_info.sample_rate音频采样率number-
audio_info.channel音频通道数number-
extra补充参数object-
extra.group_result是否将结果按照time与beat分为两个数组返回boolfalse

示例:

{
   "audio_info": {
      "format": "mp3",
      "sample_rate": 24000,
      "channel": 1
   },
   "extra": {
       "group_result": false
   }
}

响应格式

HTTP响应Content-Type: application/json

字段描述类型
task_id请求任务id,用于链路追踪、问题排查string
namespace服务接口命名空间,比如BeatTrackingstring
data请求响应二进制数据,标准base64编码,本接口无二进制数据返回string
payload请求响应文本信息,json字符串格式string
status_code状态码number
status_text状态信息string
  • 响应结果payload为json字符串格式,json内容格式如下:(当结果为空时,表明未能检测到beat信息,请检查输入音频是否正确)

    • 当请求参数group_result=false时(默认):
    字段描述类型
    beats节拍信息object array
    beats.time节拍时间点number
    beats.beat节拍拍号,有1234四种类型,分别代表"强-弱-次强-弱"(1是强拍),永远是1234一个循环,1为循环的第一个节拍number
    bpm每分钟节拍数number

    示例:

    {
      "beats": [
        {
          "time": 3.13,
          "beat": 1
        },
        {
          "time": 3.91,
          "beat": 2
        },
        // hide more beats... 
      ],
      "bpm": 78.00346
    }
    
    
    • 当请求参数group_result=true时,payload为聚合结果格式:
    字段描述类型
    time所有节拍时间点number array
    value所有节拍拍号,拍号有1234四种类型,分别代表"强-弱-次强-弱"(1是强拍),永远是1234一个循环,1为循环的第一个节拍number array
    bpm每分钟节拍数number

    示例:

    {
        "time":[0.06,0.64,1.22,1.78,2.34,2.9,3.47,4.04,4.62,5.19,5.76,6.35,6.92,7.5],
        "value":[1,2,3,4,1,2,3,4,1,2,3,4,1,2],
        "bpm":104.90464
    }
    
    

参考示例

调用方式为:POST /api/v1/invoke

Golang

// Code sample:
// use http client to invoke SAMI HTTP Service
package main

import (
	"bytes"
	"encoding/base64"
	"encoding/json"
	"fmt"
	"io/ioutil"
	"log"
	"net/http"
	"time"
)

type InvokeResponse struct {
	StatusCode int32   `form:"status_code,required" json:"status_code,required" query:"status_code,required"`
	StatusText string  `form:"status_text,required" json:"status_text,required" query:"status_text,required"`
	TaskId     string  `form:"task_id,required" json:"task_id,required" query:"task_id,required"`
	Namespace  string  `form:"namespace,required" json:"namespace,required" query:"namespace,required"`
	Payload    *string `form:"payload,omitempty" json:"payload,omitempty" query:"payload,omitempty"`
	Data       []byte  `form:"data,omitempty" json:"data,omitempty" query:"data,omitempty"`
	State      *string `form:"state,omitempty" json:"state,omitempty" query:"state,omitempty"`
}

const (
	domain = "https://sami.bytedance.com"

	// auth token
	appkey    = "your_appkey"

	// SAMI method
	version   = "v4"
	namespace = "BeatTracking"

	// dump output
	dataOutputFile    = "output.wav"
	payloadOutputFile = "output.json"
	isDump            = true
)

func main() {
	// Get token
	token := "your_token"

	// Construct HTTP request
	//   1. Read local audio file
	//   2. Set HTTP json body
	//   3. Do HTTP POST request
	audioPath := "/path/to/audio"
	content, err := ioutil.ReadFile(audioPath)
	if err != nil {
		log.Fatalf("failed to read file: %v", err)
	}
	data := base64.StdEncoding.EncodeToString(content)
	body := fmt.Sprintf(`{"data": "%v"}`, data)
	urlPath := fmt.Sprintf(
		"%v/api/v1/invoke?version=%v&token=%v&appkey=%v&namespace=%v",
		domain, version, token, appkey, namespace,
	)
	log.Printf("invoke request: %v", urlPath)

	// HTTP POST request
	start := time.Now()
	resp, err := http.Post(urlPath, "application/json", bytes.NewBuffer([]byte(body)))
	if err != nil {
		panic(err)
	}
	defer resp.Body.Close()

	// Parse HTTP response
	ret, err := ioutil.ReadAll(resp.Body)
	if err != nil || resp.StatusCode != http.StatusOK {
		panic(string(ret))
	}
	log.Printf("http invoke: cost=%vms, response: %v", time.Since(start).Milliseconds(), string(ret))

	// parse SAMI response
	samiResp := InvokeResponse{}
	payloadStr := ""
	if err = json.Unmarshal(ret, &samiResp); err != nil {
		log.Println("parse response failed", string(ret), err)
		panic(err)
	}
	if samiResp.Payload != nil {
		payloadStr = *samiResp.Payload
	}
	log.Printf("response task_id=%v, payload=%v, data=[%d]byte", samiResp.TaskId, payloadStr, len(samiResp.Data))
	if isDump && samiResp.Payload != nil {
		_ = ioutil.WriteFile(payloadOutputFile, []byte(*samiResp.Payload), 0644)
	}
	if isDump && len(samiResp.Data) > 0 {
		_ = ioutil.WriteFile(dataOutputFile, samiResp.Data, 0644)
	}
}

Nodejs

const { readFileSync } = require("fs")
const got = require("got")

const buffer = readFileSync("path/to/audio")
const req = {
    appkey: "your_appkey",
    token: "your_token",
    data: buffer.toString("base64"),
};
(async () => {
    const resp = await got.post("https://sami.bytedance.com/api/v1/invoke", {
        json: req, 
    }).json();

    console.log(resp);
    //=> {…}
})();

常见问题