메타(Meta)는 블로그 게시물에서 AWS와 같은 클라우드 제공업체와 허깅페이스(Hugging Face)와 같은 모델 라이브러리에 2024년 4월 19일 출시되는 메타의 차세대 거대언어모델(LLM) 라마(Llama)는 대부분의 현재 Ai 모델보다 성능이 더 뛰어나다고 말했다.라마(Llama) 3에는 8B(80억개)와 70B(700억개) 매개 변수가 있는 두 가지 모델이 있다. (B는 십억 개를 의미하며 모델이 얼마나 복잡하고 얼마나 많은 학습을 이해하는지 나타낸다.) 아직까지는 텍스트 기반 응답만 제공하지만 메타는 이전 버전에 비해
아마존(Amazon) 최고경영자(CEO) 앤디 재시(Andy Jassy)는 아마존의 클라우드 인프라가 Ai 활용에 필수적인 인프라가 될 것이라고 말했다.앤디 재시는 2024년 4월 11일(목) 주주들에게 보내는 연례 서한에서 "상당수의 생성Ai 애플리케이션을 직접 구축하고 있지만 궁극적으로 대다수는 다른 회사에서 구축할 것이다. 세상을 바꾸는 이 Ai의 상당 부분이 AWS를 기반으로 구축될 것으로 낙관한다."고 말했다.아마존 CEO, 앤디 제시1997년부터 아마존에서 경력을 쌓기 시작한 앤디 재시는 2021년 창립자 제프 베조스(J
유튜브 최고경영자(CEO) 닐 모한(Neal Mohan)은 OpenAI의 텍스트-비디오 생성기를 훈련하기 위해 유튜브 (YouTube) 동영상을 이용하는 것은 플랫폼의 서비스 약관을 위반하는 것이라고 말한 블룸버그 기사에 있어 소개한다.닐 모한은 이 주제에 대한 첫 공개 발언에서 OpenAI가 실제로 Ai 기반 동영상 제작 도구인 소라(Sora)를 개선하기 위해 유튜브 동영상을 이용했는지 여부에 대해서는 직접 알지 못한다고 말했다. 만약 그렇다면 이것은 유튜브의 이용약관을 "명백히 위반한 것"이 될 것이라고 말했다.닐 모한은 202
생성Ai 도구가 사람들의 목소리를 복제하는데 점점 더 능숙해지고 있다. 사기꾼들은 이러한 새로운 기능을 이용해 사기를 저지를 수 있다. 와이어드 기사에 스캠콜에 대비하기 위한 내용이 있어 소개한다. 다음 내용을 참고하여 스캠콜 사기를 당하지 않도록 주의하자. 교통사고 전화가 온다가족 중 한 명으로부터 걸려온 전화를 받았는데 교통사고가 발생했다고 말한다. 지금 당장 돈을 보내지 않으면 문제가 생길거라고 말한다. 즉시 현금을 송금해 달라고 애원하는 목소리에서 절박함이 느껴진다.분명 가족의 목소리이고 그 사람의 번호로 전화가 걸려왔지만
애플의 생성Ai 도구인 키프레이머(Keyframer)는 거대언어모델(LLM)을 이용하여 애니메이션 디자인을 생성할 수 있다. 애플은 키프레이머와 관련한 논문을 2024년 2월 8일 공개했다.애플 연구원들이 2D 이미지에 애니메이션을 어떻게 적용할지 텍스트로 설명하여 움직임을 추가할 수 있는 생성Ai 애니메이션 도구인 키프레이머(Keframer)를 공개했다.공개한 연구 논문에서 애플은 글쓰기나 이미지 생성 등 다른 생성Ai 영역에서 보여준 잠재력에도 불구하고 거대언어모델(LLM)이 애니메이션 분야에서는 다소 "과소평가되고 있다"고 말
샘 알트만은 최근 할리우드 경영진과 일련의 미팅을 가졌다고 파이낸셜 타임즈가 보도했다. 샘 알트만은 OpenAI의 새로운 동영상 생성 도구인 Sora로 영화 스튜디오의 마음을 사로잡으려 하고 있다. 일부 스튜디오는 이 툴을 제작에 사용하는 데 긍정적인 반응을 보였다.파이낸셜 타임즈는 샘 알트만과 OpenAI의 최고 운영 책임자인 브래드 라이트캡(Brad Lightcap)이 최근 파라마운트, 유니버설, 워너브라더스 디스커버리 등 할리우드 경영진과 Sora에 관한 회의를 연이어 가졌다고 보도했다.오픈AI는 2024년 2월에 동영상 생성
앤쓰로픽(Anthropic)에서 개발한 클로드(Claude)는 챗GPT보다 더 쓸만하다는 의견이 나오는 LLM 모델이다. 학술 분야나 전문 정보와 관련한 글쓰기 영역에서 더 뛰어나다는 의견이 많은데 해킹을 위한 코드 분석이나 코드 생성에는 어떨까? 티오리티비에서 두 가지 모델을 해킹 문제 풀기로 테스트 한 영상이 올라와 소개한다.아래 모든 이미지는 티오리티비의 해당 영상에서 캡쳐했다. 전체적인 흐름을 파악할 수 있도록 이미지로 먼저 소개한다. 자세한 내용을 알고 싶으면 해당 영상을 직접 살펴보기 바란다.티오리는 AIOS팀을 운영한다
앤드리슨 호로위츠 (Andreeseen Horowitz)가 선정한 'The Top 100 Gen AI Consumer Apps' 발표한 내용을 참고하면 떠오르는 생성Ai 분야에 음악과 생산성 부분을 선정했다.2023년 하반기는 챗GPT와 같은 일반적인 거대언어모델(LLM) 기반 서비스가 웹 트래픽의 대부분을 차지한다는 점에 주목했다. 업데이트된 분석에서는 음악과 생산성(연구, 코딩 지원, 문서 요약과 같은 작업 포함)이라는 두 가지 새로운 카테고리가 추가되었다.그동안 순위에 오른 음악 회사는 수노(Suno)가 유일하다. Suno는
오픈AI가 챗GPT 서비스를 회원 가입하지 않고 이용할 수 있도록 했다. 2024년 4월 1일부터 순차적으로 적용된다고 한다. AI 서비스를 이용자들이 쉽게 경험할 수 있도록 하기 위한 조치다. 185개국에서 매주 1억 명 이상의 사람들이 새로운 것을 배우고, 창의적인 영감을 얻고, 궁금증에 대한 답을 얻기 위해 챗GPT를 이용하고 있다. 4월1일부터 회원 가입하지 않고 바로 ChatGPT를 이용할 수 있다. 인공지능의 기능이 궁금한 모든 사람이 인공지능에 접근할 수 있도록 하기 위해 이 기능을 점진적으로 적용하고 있다.모든 이용자
OpenAI는 15초 분량의 음성 클립을 기반으로 합성 음성을 생성할 수 있는 자체 개발한 텍스트-음성(text-to-voice) 생성 플랫폼 음성엔진(Voice Engine)에 대한 제한적인 이용을 제공한다. Ai가 생성한 음성은 화자와 동일한 언어나 다른 여러 언어로 명령에 따라 텍스트 프롬프트를 읽어줄 수 있다.음성엔진 이용 권한을 가진 회사는 교육기술 회사인 에이지 오브 러닝(Age of Learning), 비주얼 스토리텔링 플랫폼 헤이젠(HeyGen), 의료 소프트웨어 제작사인 디마지(Dimagi), Ai 커뮤니케이션 앱
아마존(Amazon)은 2023년 9월에 발표한 두 번째 단계의 거래를 완료했다. 이번 거래에서 오픈AI(OpenAI) 라이벌인 앤쓰로픽(Anthropic)에 최대 40억 달러를 투자하기로 약속했다. 추가로 투자한 27억 5천만 달러는 아마존이 다른 회사에 투자한 금액으로는 사상 최대 규모로 빅테크 사업에서 거대언어모델(LLM, Large Language Model) 개발이 얼마나 중요한지 보여주는 또 하나의 사례다.마이크로소프트와 오픈AI에 대항아마존은 AWS를 통해 클라우드 서비스 라이벌인 마이크로소프트(Microsoft)의 O
생성Ai 관련하여 안드리슨 호로위츠(Andreessen Horowitz, a16z)에서 발표한 흥미로운 내용이 있어 소개한다. 앤드리슨 호로위츠는 마크 앤드리슨(Marc Andreessen)과 벤 호로위츠(Ben Horowitz)가 공동 설립한 미국의 IT 벤처 투자 전문 회사다. 아래는 a16z 웹사이트에 올라온 내용이다.생성Ai Top 100 소비자 앱 선정챗GPT가 생성Ai를 대중에게 등장한 후 비디오 생성도구부터 워크플로우 도구, 창의성 도구, 가상 동반자까지 Ai의 마법을 담은 수천 개의 새로운 소비자 제품이 등장했다.월간
거대언어모델(LLM, Large Language Model)과 관련한 최신 기사를 읽다보면 RAG(Retrieval Augmented Generation, 검색증강생성)이란 단어가 자주 등장한다. '검색증강생성'이란 표현도 참 어색하다. 인공지능 관련 최신 용어들을 적절한 한글로 표현하는 것조차 힘들 정도로 인공지능의 세계는 빠르게 발전하고 있다. RAG(랙)에 대해서 알아보자RAG이란 무엇인가?검색증강생성(RAG)은 자연어 처리(NLP) 작업, 특히 개방형 도메인 질문의 답변에 사용되는 접근 방식이다. 검색기반모델과 생성기반모델의
오픈AI가 휴머노이드 개발사에 투자한다. 함께 투자하는 곳이 마이크로소프트, 엔비디아와 제프 베조스다. 제프 베조스는 테슬라의 일론 머스크(Elon Musk)와 우주 비행부터 휴머노이드 로봇까지 전방위로 경쟁하는 모습이 흥미롭다. 이미 오픈AI에 투자하고 있는 마이크로소프트가 참여하는 것은 당연해 보인다. 엔비디아가 휴머노이드 로봇 영역까지 참여하는 것도 대단하다. (엔비디아의 주가는 더 오르는 것일까? ^^)오픈AI는 자사의 Ai 모델을 이용하여 휴머노이드 로봇을 개발할 계획이며 이 프로젝트는 마이크로소프트, 엔비디아, 아마존 창
오픈AI가 소라(Sora) 이후 다시 한번 놀라운 영상을 공개했다. 휴머노이드 로봇을 만드는 피겨(Figure)와 파트너십을 맺은 후 사람과 거의 완전하게 대화하고 행동하는 휴머노이드 로봇을 소개했다. 이번 시연 영상을 통해 휴머노이드 로봇이 인간과 완전한 대화를 나누는 오픈AI의 챗GPT 기술을 미리 살펴볼 수 있다.이번 시연 영상은 언젠가 "안전하지 않고 바람직하지 않은(unsafe and undesirable)" 인간의 일자리를 대체할 수 있는 범용 로봇을 개발 중인 스타트업 피겨(Figure)에서 만들었다. 2024년 2월,
SKT 플라이 AI 챌린저 4기 데모데이에서 우수상을 받은 '리클로스(ReClos)'를 소개한다. 리클로스는 가상 피팅 Ai를 활용한 초간편 패션 중고 거래 플랫폼 프로젝트다. 중고 옷 판매를 간편하게 만들어 중고 의류시장을 활성화 하자는 목표의 서비스다. 판매하는 경우, 촬영된 옷 사진에서 배경을 제거해 깔끔한 옷(상품) 사진을 만들어주고 옷 사진을 이용하여 그 옷을 입은 피팅모델 사진을 만들어준다. 기존에 옷을 입고 촬영해야 하는 귀찮은 과정을 간편하게 단축시킴과 동시에 기존 중고 거래에서 볼 수 있는 바닥에 놓인 옷 사진만 있
SKT 플라이 AI 챌린저 4기 데모데이에서 최우수상을 받은 ‘다소리’를 소개한다. 다소리는 부모가 아이의 마음에 다가가는 다문화 소통 다이어리 프로젝트다. "아동 발달에 대한 불안 해소 및 자녀와의 정서적 소통 보조"를 위한 일기 프로젝트다. 다문화 가정 내 한국어가 서툰 부모님과 아이와의 소통을 돕고자 기획되었다. 결혼 이주여성의 경우 한국어 능력이 4~5세 수준으로 다문화 가정 아동의 언어 정서와 사회적 발달이 일반 한국 아동에 비해 느린 것으로 나타났다. 다문화 가정의 부모들의 불안을 조금이라도 해소하고 아이와의 정서적인 소
SKT 플라이 AI 챌린저 4기 데모데이에서 대상을 받은 ‘그리닷’을 소개한다. 그리닷은 아이가 그림을 그리면 그림이 살아 움직이는 AI 메타 캐릭터를 생성해주는 프로젝트다. 아이는 새로운 친구가 생겨 유대감이 생기고 부모는 아이의 대화 기록을 참고함으로써 아이에게 관심을 더욱 기울일 수 있는 기회를 제공한다.Q. 처음에 어떻게 이 프로젝트의 아이디어를 내게 되었는가?동욱이는 평소 깃허브에서 빅테크 기업들의 최신 연구들을 모니터링하며 프로젝트에 적용할만한 내용은 따로 정리해둔다고 한다. 그 중 하나였던 애니메이티드 드로윙스(anim
SKT 플라이 AI 챌린저 4기 데모데이에서 우수상을 받은 ‘Novel T’를 소개한다. 노벨T(Novel T)는 ‘생성형 AI를 활용한 웹소설 숏폼 제작 프로젝트’다. 떠오르는 웹소설 시장을 겨냥해서 요즘 가장 인기있는 숏폼 마케팅에 적용할 수 있는 쇼츠/숏폼을 제작해준다. 웹소설의 줄거리나 등장인물 등 정보를 입력하면 생성AI 를 활용하여 숏폼 이미지를 제작한 후 BGM, 자막, TTS, Novel T만의 장면 효과를 삽입하여 약 1 분 가량의 영상을 제작해주는 프로젝트다.Q. 처음에 어떻게 이 프로젝트의 아이디어를 내게 되었는
암호화폐 시장에서 Ai 관련 토큰이 새롭게 주목을 받고 있다. 엔비디아(NVIDIA) 컨퍼런스에서 언급될 것으로 예상되는 암호화폐 프로젝트에 대한 투자자들의 기대감이 반영된 것으로 보인다. 이러한 움직임은 기술적 진보에 대한 전망과 함께 암호화폐 시장에서의 새로운 트렌드를 예고한다.- 엔비디아(NVIDIA) 컨퍼런스에서 암호화폐 프로젝트가 소개될 것이라는 추측으로 Ai 관련 토큰(FET, AGIX 등) 가격 급등- 밈코인(meme coin)의 판매와 함께 Ai 프로젝트로의 자금 유입 증가- 기술 기대감에 힘입어 Ai 토큰이 글로벌
구글은 일론 머스크로부터 제미나이(Gemini)가 역사적 맥락에서 생성된 사람 이미지가 인종에 대한 오해를 불러 일으킬 수 있다는 비판을 받은 후 제미나이 이미지 생성기의 사람 이미지 생성 기능을 "일시 중지"한다고 2024년 2월 22일(목)에 발표했다.1. 구글은 2월 21일(수) "이러한 종류의 묘사를 즉시 개선하기 위해 노력하고 있다"고 밝혔지만 24시간도 채 지나지 않아 인물 사진을 비활성화하면서 곧 "개선된 버전의 서비스"를 약속했다.2. 구글의 제미나이 익스피리언스 제품 디렉터인 잭 크로지크(Jack Krawczyk)는