본문 바로가기
AI (GPT4, 로컬 LLM)

MS COPLIOT 을 써보다 (비교 CHATGPT)

by 자루스 2026. 1. 31.

[실사용기] 코파일럿은 말은 그럴싸한데… 알람 테스트에서 신뢰가 깨졌다

코파일럿은 생각보다 말을 꽤 그럴싸하게 한다.

반응 속도도 조금 빠른 편이고,
한국어 발음은 마치 원어민 선생님이 유창하게 한국어를 말하는 느낌에 가깝다.
이 부분은 분명 호불호가 갈릴 수 있겠다.

브라우저에 붙어 있는 기능도 있지만, 나는 따로 설치해서 사용해봤다.
다만 무료라는 점을 감안하더라도, 기능은 기대에 비해 아쉬운 부분이 많았다.


느낀 점 요약

  1. 말은 그럴싸하다
    - 이 부분은 확실히 신경을 많이 쓴 느낌이다.
  2. 하지만 깊이 있는 설명을 잘 못 한다
    - 표면적인 설명은 가능하지만, 맥락을 따라가며 자세히 파고드는 능력은 부족하다.
  3. 개인 맞춤이 서툴다
    - 이 부분에서는 확실히 차이가 난다. 무료 서비스이니 할 말은 없지만, 아쉬운 건 어쩔 수 없다.

리마인드(알람) 기능 테스트에서의 문제

특히 리마인드 알람 기능 테스트에서 꽤 흥미로운 이슈가 있었다.

  • GPT 유료 버전은 알람이 된다.
  • Copilot은 된다고 주장하지만, 실제로는 안 된다.

테스트 과정은 아래와 같았다.

  1. “웹이 아니라 앱에서는 된다”고 함 → 실패
  2. “맥 앱이 아니라 휴대폰 앱에서는 된다”고 함 → 실패

처음에는 “채팅창에서만 되는 기능”이라고 했다가,
안 된다고 하자 “자신의 실수였다”고 한다.

이 장면이 조금 재미있긴 했다.
하지만 결론은 단순하다.

실수가 아니라, 기능 자체가 없다.

웹, 맥 앱, 모바일 앱 모두 테스트했지만 어느 환경에서도 실제 알람은 작동하지 않았다.
1분 후, 정확히 60초 뒤에 알람을 줘라”라고 했을 때도 알람은 오지 않았다.

시간을 물어보니 “거의 시간이 다 됐어”라는 식의 답변이 돌아온다.
그리고 실제로 60초가 지난 뒤 다시 말을 걸자, 자기는 “제대로 한 것”이라고 주장한다.

이쯤 되면 신뢰가 깨질 수밖에 없다.


공통적으로 발견한 문제: 실시간 정보 정확도

그리고 흥미롭게도, 두 서비스 모두에서 공통적으로 발견한 문제가 하나 있다. 바로 실시간 정보 정확도다.

  • “지금 비트코인 가격을 알려달라”고 했더니 이상한 가격을 말한다.
  • “현재 시간 기준, 바이낸스 기준으로 달라”고 해도 여전히 납득하기 어려운 가격이 나온다.

이 상황에서 자연스럽게 떠오른 ...

“인터넷(AI)에 떠도는 것을 믿지 말아라.”
— 아브라함 링컨 —

정리

정리하자면,
코파일럿은 “말을 그럴싸하게 하는 AI”에는 가깝지만,
내가 기대했던 “신뢰할 수 있는 비서”나 “도구”로 쓰기에는 아직 부족했다.

반면 GPT 유료 버전은 말투가 더 화려하지는 않아도,
실제로 맡길 수 있는 일의 범위가 훨씬 넓고,
특히 리마인드/알람처럼 ‘기능이 실제로 되는가’에서 차이가 확실히 났다.

다음에는 코파일럿이 “그럴싸함”을 넘어
“검증 가능한 기능”으로 신뢰를 회복할 수 있을지 다시 확인해봐야겠다.
"무료는 무료일뿐"
단 영어회화할때는 괜찮은거 같다. 기분이 좋아져서 원어민과 이야기 하는 느낌