几位 AI 工程师,开源了自己的撩妹项目

7,105 阅读3分钟

如果你们还觉得工程师在撩妹上没有天赋的话,那你就大错特错了。

就在不久前 Facebook 的几个程序员最近也弄出一款音乐神器,可以把一首曲子,用 6 种不同的乐器演奏出来。然后 Google 的技术大拿们也不甘示弱,用 AI 搞出了一个音乐合成器正式加入专业撩妹俱乐部。

代码音乐家速成指南

大家都知道,通过 CNN 可以将图片进行风格重构,比如做点滤镜,让你的自拍照看起来像凡高的作品,业内也把这种卷积神经网络又叫神经网络迁移(Nural)。

受此启发,工程师们尝试把 CNN 运用到音乐上,希望搞点大事情,比如让 AI 像人类一样,用口哨来演奏音乐。


(小哥哥们认真 coding 的状态神似郎朗

实操上,大家也都知道 AI 不可能直接读取音符,所以首先必须将音符转换成机器能够识别的样式,然后通过 CNN 进行解码重构,再生成新的文件。

clipboard.png

经过不断调试,他们已经可以将同一首曲子,用 6 种不同风格的乐器演奏出来,包括模仿人类吹口哨。

Google 小哥哥怎么搞 AI 音乐

FaceBook 小哥哥们鼓捣出的这套程序目前只能对音乐进行风格切换,听起来还不够浪漫,Google 的工程师随即放了撩妹大招:

「为妹子创造一个独一无二的声音。」

Magenta 是 Google 内部发起的一个与音乐结合的 AI 项目,专门探索如何将机器学习应用到音乐创作中。他们发布了 NSynth(神经合成器),这个项目是主要作者是 Yotam Mann ,他依靠深度神经网络来学习声音的特征,并根据这些特征生成一个前所未有的声音。

Yotam 认为之所以经典乐器会流行,就是因为无论是钢琴还是吉他,或是二胡,都有自己独特的音色和音域。而自己所写的 NSynth 并不是将声音简单的混合在一起,也不是重构音乐风格。

clipboard.png

而是利用原始声音的声学特征来合成一种全新的声音,比如将笛子和琴声按比例进行搭配,创造出新的声音。

在 Yotam 建立的 NSythTH 算法中,先通过生成一个压缩的声音( 用 Z 表示 )。然后,解码器网络将其转换成回声,再对整个系统进行训练,使输出的声音尽可能更接近真实声音。


clipboard.png


为了降低 NSynth 的使用门槛,Magenta 跟 Google Creative Lab 合作创建了 NSynth Super,这是一款开放源代码的音乐合成硬件产品。

clipboard.png

通过预先载入的超 过10 万个声音,NSynth Super 通过算法就已经创造出很多声音,你可以通过拨号盘选择这些声音。当然,你也可以通过触摸屏创造新的声音。

目前,已经有不少专业的音乐制作人在使用这款产品。艺术创作需要灵感,这种全新的声音合成在可玩性、创意性上同样会给创造者提供一些不一样的启发。

如果你对 NSynth Super 源代码、原理图和设计模板等感兴趣,可以在 GitHub 找到 demo。

clipboard.png

clipboard.png

这位眼神中透露着深情的小哥哥就是 Yotam Mann ,听说他几乎没有单身过。

超神经小百科

单词

Saturation
[ˌsætʃəˈreʃən] n. 饱和度

Exaggerated
[ɪgˈzædʒəreɪtɪd] adj. v. 扩大

词组

fundamental frequency 基音频率
intuitive parameters 直观参数
Single dog 单身狗
clipboard.png