▩ 음성 분류 신경망 만들기

이미지 ----------------> 신경망 음성 -----------------> 신경망

▩ 1. 개와 고양이 음성 분류 신경망 코드 설명

데이터 수집 및 준비
  1. cat_and_dog_classification_설명단것.ipynb 를 다운받아 코랩에 올립니다.
  1. 19기를 위한 개와 고양이 음성분류 신경망 만들기를 위한 사전 설명들_그림.pdf 를 다운 받습니다.

  2. 아래의 사이트에서 소리 데이터 데이터를 내려받습니다. https://www.kaggle.com/datasets/mmoreaux/audio-cats-and-dogs?select=cats_dogs 다운로드 받으면 archive.zip 파일이 생기는데 이 압축을 풀면 archive 라는 폴더가 생깁니다.

  3. archive 폴더 밑에 cats_dogs 라는 폴더가 있는데 이 폴더를 압축해서 cats_dogs.zip 파일로 만드시오!

  4. 코렙에서 구글 드라이브를 마운트 시킵니다.

from google.colab import drive
drive.mount('/content/drive')
  1. /content/drive/MyDrive/Colab Notebooks 밑에 cats_dogs.zip 파일을 올립니다.

  2. /content/drive/MyDrive/Colab Notebooks 밑에 cats_dogs 라는 폴더를 만듭니다.

  3. 코렙에 올린 압축파일 cats_dogs.zip 파일을 /content/drive/MyDrive/Colab Notebooks/cats_dogs 폴더 밑에 압축을 풉니다.

!unzip -qq "/content/drive/MyDrive/Colab Notebooks/cats_dogs.zip" -d "/content/drive/MyDrive/Colab Notebooks/cats_dogs"

여기까지 하면 준비 작업은 된것 입니다.

이론 파트
  1. 이론 설명을 위해서 c 드라이브 밑에 sound 라는 폴더를 만들고 001.wav 와 002.wav 를 내려받으세요. sound 폴더에 다운로드 받으세요. 라이브로사 연습 샘플 파일 : https://cafe.daum.net/oracleoracle/SjiT/649

  2. 로컬 주피터 노트북에서 !pip install librosa 를 실행하여 라이브로사를 설치합니다.

    !pip install librosa
    
  3. 그리고 커널 리스타트를 하세요.

주파수가 낮은 대역에서는 주파수의 변화를 잘 감지하는데 주파수가 높은 대역에서는 주파수의 변화를 잘 감지하지 못합니다.

이 이유를 달팽기관 구조로 보면 달팽이관에서 저주파 대역을 감지하는 부분은 굵지만 고주파 대역을 감지하는 부분은 갈수록 얇아집니다.

그렇다면, 신경망에 특징 백터를 사용할 때 그냥 주파수를 쓰기보다는 이러한 달팽이관의 특성에 맞춰서 특징을 뽑아주는것이 더욱 신경망 학습할때 효과적인 피쳐를 뽑는 방법입니다.

▩ 개과 고양이 소리 분류 신경망 만들기