한 언어에서 다른 언어로 코드를 번역하는 방법을 배운 AI

과학자들은 인공 지능 시스템과 기계 학습이

점점 더 똑똑해지고 이해할 수 있을 뿐만 아니라텍스트뿐만 아니라 쓰기도 가능합니다. 그러나 그들은 여전히 ​​프로그래밍 언어에 대한 지식이 거의 없습니다. 이 문제를 해결하기 위해 IBM은 Think 2021에서 자사 연구원들이 코드 번역용 AI인 IBM CodeNet 프로젝트를 만들었다고 발표했습니다.

“우리는 자체 ImageNet이 필요합니다.혁신적인 아이디어를 탐구하고 다양한 알고리즘에 반영한다고 연구원들은 지적했다. -CodeNet은 사실 컴퓨터 용 ImageNet입니다. COBOL 및 FORTRAN에서 Java, C ++ 및 Python에 이르기까지 55 개가 넘는 레거시 및 활성 언어로 1,400 만 청크와 5 억 줄로 구성된 AI / ML 시스템을 교육하기위한 대규모 데이터 세트입니다. "

그들은 데이터 세트가 이렇게 구축되었다고 설명했습니다.양방향 번역이 가능합니다. 즉, 사용자는 은행과 정부에서 자주 사용되는 오래된 코드를 Java 및 다른 언어로 번역 할 수 있습니다.

Newspeak, Interslavic 및 Esperanto: 과학이 인위적으로 언어를 만드는 방법

과학자들은 데이터 세트가많은 종류의 프로그래밍 경연 대회와 모든 종류의 문제-일부는 더 고급, 일부는 더 학문적입니다. 또한 이러한 언어는 지난 10 년 반 동안 이러한 대회의 많은 부분에서 사용되었으며 그 솔루션은 수천 명의 학생들이 대표했습니다.

사용자는 개별적으로 실행할 수도 있습니다."메타 데이터를 추출하고 생성 적 AI 모델의 정확성을 확인하기위한"코드 덩어리. 이를 통해 연구원은 한 프로그래밍 언어를 다른 프로그래밍 언어로 번역 할 때 동등한 코드를 프로그래밍 할 수 있습니다.

과학자들은 그들의 개발이 중요하다고 덧붙였습니다.이러한 결정을 설명 할 수있는 능력과 함께 자동화 된 추론 및 의사 결정. 실제로 이것은 컴퓨터 비전 및 자연어 처리와 동일한 모델 개발 분야입니다.

더 읽어보기

가장 강력한 새로운 레이저의 강도는 지구에 떨어지는 태양의 빛과 비슷합니다.

물리학 자들은 블랙홀의 아날로그를 만들어 호킹의 이론을 확인했습니다. 어디로 가는가?

세계 최초의 정확한지도가 만들어졌습니다. 다른 사람들에게 무슨 문제가 있습니까?