ActionPower·Nov 4, 2022[AI 맛보기] 동영상 설명 및 요약(Video Captioning/Explaining)Video Explaining 이란? 주어진 영상의 내용을 한 눈에 알아볼 수 있도록, 정리/요약/분류해주는 모든 방법들을 의미합니다. 주로 사용되는 방식은 다음과 같습니다. 동영상 전체 내용을 요약한 하나의 문장을 생성하는 방식 미리 지정된 카테고리 중 동영상과 가장 관련성이 높은 하나를 선택하는 방식AI4 min readAI4 min read
ActionPower·Jun 8, 2022[STT 전처리] 1. 음향 이벤트 감지 Sound Event Detection (SED)특정 이벤트의 발생 여부 및 발생 시각을 감지하는 기술 — 어떤 상황일까요? 구급차나 소방차 또는 경찰차가 지나가는 소리입니다. 이처럼 사람은 소리로 어떤 상황인지 파악하고, 소리의 종류를 판단할 수 있는데요. 인공지능이 소리로 상황을 파악하고, 상황에 대응할 수 있다면 얼마나 좋을까요? 예를 들어, 소리로 위기 상황을 감지하고 사람에게 알려줄 수 있겠죠. 소리로 상황을 감지하고 해당 소 …AI6 min readAI6 min read
ActionPower·Jun 15, 2022[STT 전처리] 2. 음성 향상(Speech Enhancement)오디오에서 잡음을 제거하고, 필요한 소리의 품질을 높여주는 기술 — 통화할 때 주변 소리 때문에 상대방의 목소리가 잘 들리지 않으시나요? 그 때가 바로 불필요한 잡음은 제거하고, 필요한 음성의 품질을 높여주는 음성 향상(Speech Enhancement) 기술이 필요한 순간일 겁니다.AI4 min readAI4 min read
ActionPower·Jun 21, 2022[음성 인식] 1. 화자 분리 (Speaker Diarization)회의나 대화, 통화 녹음처럼 여러 명의 목소리를 받아 적어야 하는 경우가 있습니다. 이 때 컴퓨터가 참여자들의 목소리를 자동으로 구분해준다면 정말 편리하겠죠? 화자 분리(Speaker Diarization)AI6 min readAI6 min read
ActionPower·Jul 5, 2022[음성인식] 2. STT(Speech-to-Text)음성 인식 기술, STT란? STT(Speech-to-Text)라고도 불리는 음성 인식은 음성(Speech)를 글자(Text)로 바꿔주는 기술입니다. 이 음성 인식 기술을 활용할 수 있는 경우는 무궁무진한데요. 예를 들면, 넓은 강의실에서 수업을 하시는 교수님의 말씀이나 고객과의 중요한 전화 통화 내용, 회사의 업무 회의 내용, 아침 뉴스 …AI8 min readAI8 min read
ActionPower·Jul 12, 2022액션파워의 음성 인식 기술 이야기액션파워는 세계 최고의 AI 기술과 솔루션으로 꿈꿔왔던 편리한 세상을 만들고자 합니다. daglo with STT 액션파워가 서비스하고 있는 다글로(daglo)는 세상의 모든 소리를 다 글로 바꿀 수 있습니다. “소리를 글로 받아 적기 위해” 최신 딥 러닝 기반의 End-to-End 음성 인식 STT(Speech-To-Text) 엔진을 …음성인식5 min read음성인식5 min read
ActionPower·Jul 19, 2022[음성인식] 3. RT-STT (Real Time Speech-to-Text)1. 음성 인식 방식 음성을 인식하는 방식은 크게 ‘배치 음성 인식’과 ‘스트리밍 음성 인식’ 2가지로 나눌 수 있습니다. (1) 배치 음성 인식 통상적으로 STT 음성 인식을 말할 때는 배치 음성 인식을 뜻합니다. 긴 길이의 음성 (몇 분 ~ 몇 시간)의 음성을 한 번에 입력으로 받아 전체 음성에 대해서 한 번에 받아쓰기를 하는 방식입니다. 입력으로 받는 음성 …AI5 min readAI5 min read
ActionPower·Jul 26, 2022[일상에 스며든 AI 음성인식 서비스] 화자 검증 (Speaker Verification)지문처럼, 목소리에도 개인을 식별할 수 있는 성문이 있습니다. 이를 통해 목소리로 사람을 식별할 수 있는데요. 예를 들어, 질문이 개인 정보에 관한 것일 때, AI는 음성 인증을 통해 사용자의 음성과 일치하는 경우에만 답변을 제공합니다. 또는, 자동으로 목소리의 주인인 발화자를 인식해 회의록을 작성할 때 활용할 …AI3 min readAI3 min read
ActionPower·Aug 2, 2022[일상에 스며든 AI 음성인식 서비스] 텍스트 요약 (Summary)인공지능이 긴 글을 요약해준다면 삶이 얼마나 더 편리해질까요? SF영화 같은 이 일은 이제 현실이 되었습니다. 실제로 가능해졌거든요. 예를 들어, 어떤 분야에 대한 내용인지 한 문장으로 요약을 제공할 수 있어요. 또는, 원문보다 짧지만 어느 정도 길이가 있는 요약을 제공할 수도 있죠. 요약에는 크게 대화 요약과 산문 …AI4 min readAI4 min read
ActionPower·Aug 10, 2022[일상에 스며든 AI 음성인식 서비스] 텍스트 교정 (Correction)액션파워의 음성 인식 엔진은 뛰어난 성능을 자랑하지만, STT 출력 결과 텍스트는 필연적으로 완전할 수 없습니다. 하지만 불완전한 STT 출력 텍스트에 다양한 교정이 수행된다면, 가독성이 향상될 수 있겠죠? 액션파워는 오늘도 인공지능 AI를 통해 텍스트 교정을 고도화하고 있답니다. 띄어쓰기 및 문장 부호 삽입 띄어쓰기 및 문장 부호 삽입은 …AI6 min readAI6 min read
ActionPower·Aug 17, 2022[일상에 스며든 AI 음성 인식 서비스] 텍스트 감정 분석 (Text Sentiment Detection)액션파워는 AI 음성 인식 기술로 텍스트의 감정을 판별할 수 있습니다. 텍스트 감정 분석을 통해 화자의 상황과 문맥에 대한 정보 등을 얻을 수 있어요. 텍스트의 토큰화 (Text tokenization)AI5 min readAI5 min read
ActionPower·Aug 23, 2022[일상에 스며든 AI 음성 인식 서비스] 텍스트 / 비디오 질의 응답(Text/Video Question Answering)액션파워는 AI 기술로 텍스트 파일 뿐만 아니라, 비디오 파일을 가지고도 질의 응답(Question Answering)을 구현할 수 있어요. 비디오 파일은 비디오의 음성을 STT(Speech-To-Text) 처리한 텍스트 파일을 기초로 질의 응답 모델을 구현할 수 있어요. QA(Question Answering) QA는 크게 open-book questio …AI6 min readAI6 min read
ActionPower·Sep 6, 2022[일상에 스며든 AI 음성 인식 서비스] Text-To-Speech (TTS)액션파워는 AI 기술로 음성 합성 (Text-To-Speech)을 구현할 수 있습니다. 음성 합성 (TTS) 기술을 통해 텍스트를 음성으로 변환할 수 있어요. 정확한 음성 합성 구현을 위해서는 몇 가지 과정을 거쳐야 합니다. 데이터 전처리 데이터 전처리 과정에서 불필요한 특수 문자를 제거하고, 숫자, 영어 등과 같은 표현을 …AI5 min readAI5 min read
ActionPower·Sep 23, 2022[일상에 스며든 AI 기술] 비디오 요약(Video Summary)전세계 인터넷 트래픽에서 비디오가 차지하는 비중이 점점 늘어나고 있습니다. 시스코의 조사 결과(Cisco VNI Complete Forecast Highlights)에 따르면, 2016년에는 67%인 비디오 트래픽 비중이 2022년에는 무려 80%에 이르렀다고 하는데요. 최근 우리 주변에서 비디오 콘텐츠를 소비하는 …AI5 min readAI5 min read