Kategorier
AI - Artificiell intelligens Spaningar

Digitala spaningar vecka 43 2024 – del 2

ChatGPT:s avancerade röstläge släppt i Sverige. Senaste versionen av AI-boten Claude kan kontrollera din dator. Microsoft gör det möjligt att bygga autonoma Copilot-AI-agenter. Canva släpper vassare AI-bildverktyg.

Spaningar inom tech och sociala medier från veckan som har gått.

Övriga delar i veckans sammanställning

 

AI – artificiell intelligens

ChatGPT:s avancerade röstläge släppt i Sverige (på riktigt den här gången?)

Plötsligt händer det!

Infoga kommentarer:

  • ”Jag har kört det via VPN sedan innan ChatGPT eller VPN fanns!”
  • ”Jag har har kört det UTAN VPN längreändukansägastjärnstopp!”
  • ”EU är dumma!”
  • ”Du använder ChatGPT:s avancerade röstläge FEL! Här är 936 sätt som du borde använda det!”

Synd bara att EU hann gå under eftersom vi (ja, eller jag) fick vänta i 22 dagar på att få funktionen.

Open AI kan lansera nästa stora språkmodell i december

Snart fyller ChatGPT två år och det tänker ägaren Open AI fira. Fira genom att släppa sin nästa stora språkmodell.

Enligt The Verge så är det då dags för Orion att se dagens ljus. Det ser däremot inte ut som att det kommer att trilla ut som ett nytt alternativ inuti ChatGPT. Istället så kommer några företag som Open AI ”arbetar nära med” att först få tillgång så att de därmed kan bygga sina egna produkter och tjänster baserat på Orion.

Det kan alltså vara GPT-5 vi pratar om. Men med tanke på att den senaste större uppdateringen från Open AI var o1, som ska vara bättre på att resonera sig fram till ett svar, inte var baserad på GPT, utan på en helt ny modell så är frågan alltså var någonstans i modellkartan som Orion hör hemma. Om det är en ny GPT eller en skarp o1 som ligger i botten.

Mot slutet av året vet vi kanske. Beroende på hur träffsäkra uppgifterna om en decemberlansering är.

OpenAI plans to release its next big AI model by December

Open AI avfärdar ryktet om att Open AI:s nästa språkmodell släpps i år

I veckan kom uppgifter, via The Verge, som pekar på att Open AI ska släppa ”GPT-5” i december. Ja, eller åtminstone nästa stora uppdatering av företagets språkmodell. Alla verkar däremot inte ge lika mycket för de här uppgifterna.

En av dem som sågar ryktet är… Open AI:s VD Sam Altman.

I en FKA tweet avfärdar Altman The Verges artikel med ”fake news out of control”. Vilket… känns såväl väldigt definitivt som väldigt vagt. Vi vet med andra ord vad det är som Altman underkänner. Att nästa generation får namnet ”Orion”? Att det inte är en GPT-5 utan något helt nytt? Att den kommer att släppas i december? Att kanske-Orion inte kommer att släppas via ChatGPT, utan till att börja med bara bli tillgänglig för några utvalda partnerföretag? Alltihop?

Altman gör oavsett precis som han gjorde när det började florera vilda rykten om GPT-4. Fast den här gången är han lite mer… kortfattad i sin 2024-tonalitetsformulering.

Sen kan det förstås också vara så att The Verges uppgifter är spot on på precis alla sätt och vis och Altman är sur över det (och har inlett intern Stasi-jakt för att hitta läckorna).

Och inte långt efter Altmans utspel så kom officiell kommunikation från Open AI: efterföljaren till GPT-4 kommer inte lanseras i år.

OpenAI CEO responds to report of GPT-5 Orion coming later this year: ‘Fake news out of control’

AI-boten Claude kan kontrollera din dator

För något halvår sedan presenterades ännu en sån där AI-pryl som vill ersätta mobilen: 01 Light (som då inte är samma sak som ChatGPT:s o1 – tur att AI-bolagens namngivningar inte är lagom förvirrande). Nu är det ChatGPT-utmanaren Claudes tur att göra något liknande.

01 Light bestod sedan av två delar: dels själva hårdvaruprylen som man kunde AI-prata med och dels en mjukvarudel som kunde kontrollera din dator. Bokstavligen. Tanken var att man visade 01 Light hur ett kommando skulle utföras genom att klicka sig igenom de nödvändiga stegen, som att öppna ett visst program och utföra något i det. AI:n skulle alltså handgripligen lära sig hur ett kommando skulle utföras genom att titta på skärmen när det utfördes.

När jag började skriva om den här nyheten så insåg jag att… jag inte har hört något om eller från 01 Light sedan produkten först presenterades. Så inte… världsherravälde än. Men det hindrar alltså inte Google- och Amazon-backade Anthropic från att ge sig in på samma område.

I Claude-fallet pratar vi dock inte om en hårdvarupryl, men väl att AI-boten har uppdaterats till version 3.5 och då lärt sig att kontrollera en dator. Det är mer specifikt en ny funktion i API:et (Computer Use) – än så länge i öppen beta – som gör att Claude kan lära sig att härma tangenttryckningar, knapptryckningar och musgester.

Precis som i fallet 01 Light så är tanken att man på detta sätt kan låta Claude utföra saker i program utanför Claudes egen lilla ”sandlåda”. Och till och med bygga in den här funktionaliteten i en mer eller mindre helt självgående AI-agent. Alltså en AI-lösning som är tänkt att själv kunna komma fram till hur den bäst löser en viss uppgift som den har fått, inklusive vilket program som bäst gör jobbet för det.

Det är också lite det här som Apple ha målat upp som tänkt användningsområde för en AI-smartare Siri som sannolikt kommer att lanseras i början av nästa år som del av Apples AI-plattform Apple Intelligence. Att Siri alltså ska kunna göra mer med och i appar.

Det återstår att se hur bra såväl Claude som Siri är på det här när de väl får det här stödet. Men för den som är sugen att börja Claude-leka så finns API:et nu alltså tillgängligt.

Anthropic’s new AI model can control your PC

Microsoft gör det möjligt att bygga autonoma Copilot-AI-agenter

Senaste initiativet från Microsoft i AI-racet: stöd för autonoma AI-agenter. Ja, eller mer specifikt: stöd för företag att bygga sina egna Copilot-agenter via Microsofts Copilot Studio.

AI-agenter är – eller är åtminstone tänkta att – vara nästa steg efter AI-assistenter som ChatGPT och de övriga liknande AI-tjänsterna som är vanliga idag. Till skillnad från assistenter, som i stort kräver mänsklig input för att sedan kunna utföra saker, så ska AI-agenter kunna ta sig an uppgifter helt på egen hand. Eller åtminstone nästan helt på egen hand.

Med andra ord: själv lista hur den ska lösa en uppgift. Som vilka verktyg som behöver användas. Ännu mer som hur en människa hanterar detta, alltså.

Microsoft kommer att börja rulla ut sin AI-byggarverkstad från och med november. Microsoft passar också på att släppa 10 nya ”färdiga” agenter inom ramen för affärssystemet/CRM-systemet Dynamics 365. Här pratar vi om agenter som kan ta sig an vanliga handgrepp inom försäljning, kundservice, finans och logistik.

Microsoft to roll out new autonomous AI agents next month, fending off challenge from Salesforce

X släpper API för sin AI-modell Grok

Dags för även FKA Twitter att bli med API för sin AI-satsning. Grok blir nu alltså åtkomligt för utvecklare som vill bygga på och mot tjänsten.

Som alltid när det kommer till X så är det inte helt klart exakt vad det är man får. API:et ska vara baserat på grok-beta, som är ett nytt namn i sällskapet av Grok-modeller. Det ser också ut som att xAI:s ChatGPT-utmanare ska ha stöd för bildfunktionalitet, så att den alltså kan tolka även bildinput. Däremot är den biten ännu inte live.

”Beta”-namnet i Grok-modellen gör att vi nog kan vara säkra på att API:et i stort har betastämpel. Det återstår att se när det släpps i en mer slutgiltig, skarp version.

xAI, Elon Musk’s AI startup, launches an API

Perplexity släpper Mac-app

Är du Perplexity-knarkare? Tycker du att den som har flesta AI-appar när den dör vinner? Grattis!

Nu är AI-söktjänsten Perplexity med andra ord senast ut med att släppa en officiell datorapp för sin tjänst. För den som kör Mac-åtminstone.

(Du som tvingas köra Windows av din arbetsgivare eller bara inte tycker om dig själv får däremot fortsätta använda Perplexity i webbläsaren ett tag till. Eller hitta något inofficiellt.)

Perplexity launches a native Mac app

Perplexity stäms av ännu fler företag för upphovsrättsbrott

I förra veckan skrev jag om hur New York Times har fått nog av att AI-söktjänsten tränar sina botar och modeller på tidningens innehåll utan lov eller ersättning. Nu får New York Times sällskap av Dow Jones och New York Post som alltså gör samma sak.

Det sätter åter fingret på en av de absolut största utmaning för AI-bolagen: att få tillgång till data för att träna sina massiva AI-modeller.

Så här långt har det i mångt och mycket handlat om att ta innehåll utan att betala för det – och sedan ta betalt för, i praktiken, samma innehåll av sina egna kunder. Men i takt med att innehållsföretag har insett det nya värdet på innehållet (som AI-träningsdata) så har allt fler börjat blocka AI-botar från sina sajter. Det har fått Open AI att börja shoppa rättigheter på löpande band (däremot inte med New York Times, som även har stämt just Open AI för det här).

Perplexity har varit i extra mycket i blåsväder på grund av två saker: dels att tjänsten har anklagats för att ignorera vad som står i den så kallade robots.txt-filen (där sajter kan ange bland annat om botar ska få tillgång till materialet) och dels att de också påstås ha jobbat in sina AI-botar bakom betalväggar och tränat på inlåst material.

Till skillnad från Open AI så har Perplexity, vad jag vet, inte betalat för AI-träningsinnehåll. De presenterade nyligen något slags ”annonsintäktsdelningsupplägg” med nyhetssajter, där de senare skulle få del av de intäkter som kan komma från annonser som visas i innehåll som syns tillsammans med en annons. Men ingen vet hur mycket pengar det kan handla om och det lär handla om småsmulor jämfört med de summor som Open AI ska ha lagt på att skaffa sig rättigheter till innehåll.

Nyhetssajterna vill helt enkelt ha bra mycket mer betalt för att dela med sig av sitt innehåll till AI-bolag som Perplexity. Och vissa har säkerligen ambitioner att skapa helt egna Perplexity-alternativ baserat på det egna innehållet.

Dow Jones and New York Post Sue AI Startup Perplexity, Alleging ‘Massive’ Copyright Infringement

Perplexity hanterar 100 miljoner sökningar varje vecka

AI-sökmotorn Perplexity fortsätter att bli allt mer populär som Google-alternativ. Nu har företaget gått ut med att det görs 100 miljoner sökningar i tjänsten varje vecka.

Det innebär runt 400 miljoner sökningar i månaden, vilket är en ökning från de 250 miljoner som Perplexity rapporterade i juli. Upp 60 %.

Precis som Open AI så har Perplexity alltså gått från att rapportera månadssiffror till att bryta ned dem på veckonivå. Vi vet med andra ord inte egentligen hur månadssiffran ser ut (med andra ord om det är snitt eller en kort tidsperiod som Perplexity har tittat på). 

Det är med andra ord en intressant utveckling. Å ena sidan är veckomåttet en tydligare engagemangssignal än månadsmotsvarigheten, å andra sidan brukar företag byta vilken parameter de lyfter fram när den tidigare måttstocken inte längre ser lika kul ut. Med andra ord: när utvecklingen ser bättre ut om man byter till ett annat mått.

Oavsett så tuffar Perplexity på bra – vilket också gör att tjänsten allt mer hamnar i stämningsfokus. Efter att New York Times för inte så länge sedan stämde Perplexity därför att tjänsten utan lov eller ersättning ska ha tränat på tidningens innehåll så trillade det den här veckan in motsvarande stämningar från Dow Jones och New York Post.

Perplexity says it’s now serving 100M search queries a week

Canva släpper vassare AI-bildverktyg

Dags för många innnehållsskapares favoritverktygslåda Canva att uppgradera sina verktyg. Och ja, det handlar förstås om AI.

Det är mer specifikt verktyget som kan skapa bilder från textbeskrivningar som nu vässas. Uppgraderingen baseras på uppköpet Leonardo.ai, som är tänkt att alltså kunna ge ännu bättre bilder än tidigare version.

En av de konkreta förbättringarna är att Canvas funktion nu ska kunna hänvisa till en annan bild som ”mall” för hur man vill att slutresultatet ska se ut.

Dessutom gör Canva några övriga förbättringar bland sina AI-verktyg, som att whiteboardfunktionen har stöd för summeringar, automatisk textning i videos och stöd för interaktiva diagram i presentationer.

Canva has a shiny new text-to-image generator

Apple börjar rulla ut Apple Intelligence i december

Det ser ut som att Apple trots allt hinner rulla ut sin kommande AI-plattform Apple Intelligence under 2024. I elfte timme. I december, alltså.

I nästa vecka landar nästa omgång uppdateringar av Apples olika operativsystem, som iOS 18.1. Men Apple har nu bekräftat att de kommer hinna med en uppdatering till innan året är slut. Och i betaversionerna av respektive operativ som nu har blivit tillgängliga så finns de första Intelligence-funktionerna med. Ja, eller de första riktigt ordentliga funktionerna.

I de uppdateringar som kommer nästa vecka så finns några gen AI-funktioner med, som stöd för att transkribera och sammanfatta telefonsamtal samt några text- och bildfunktioner. Men i december så börjar Apple att på riktigt bygga den sammanhållande plattform som ska genomsyra operativen när det kommer till AI. Inte minst funktionen som gör att Siri kan bli betydligt smartare (återstår att se hur smart), bland annat genom att ringa hem till ChatGPT om Siri känner behov av en livlina.

Som tidigare så måste man ha engelska inställt som språk och funktionerna kommer heller inte att finnas tillgängliga överallt. Som hos oss i EU, på grund av Apple inte känner att de har fått alla svar de vill från EU kring hur de senare kommer att se på AI-funktionerna i relation till techregleringslagen Digital markets act.

(Så nu följer kommentarer om att det är kört för EU i AI-racet och överlag på grund av det här.)

Apple releases APIs for Apple Intelligence and localized English language support

Apple släpper API:er för Apple Intelligence

Apple börjar så sakteliga närma sig lansering av sin AI-plattform Apple Intelligence. I de två uppdateringar som återstår i år för Apples olika operativsystem så kommer de första funktionerna att läggas till. Sedan får vi vänta till nästa år innan vi får resten (ja, om allt går som det ska).

Nu släpper Apple dessutom tre API:er för några av funktionerna: skrivverktyget, Image playground och Genmoiji. Nu blir det möjligt för utvecklare att lägga till Apples verktyg för att hjälpa till med skrivande, för att skapa bilder via text eller för att skapa egna anpassade emojis i sina appar.

Apple releases APIs for Apple Intelligence and localized English language support

Notion arbetar på ny AI-mejlklient

Notion, som står bakom den smarta kalendern med samma namn, har nu vänt sin uppmärksamhet till mejlprogrammen. Som kan bli mycket bättre. Om man frågar Notion.

Notion tänker stå ut i konkurrensen genom att ”destillera ned e-post till sina byggstenar”. Tanken är att man ska kunna bygga upp själva gränssnittet rätt mycket precis så som man vill ha det.

Men sedan är stora tanken med Notions mejlklient att det ska finnas sedvanligt mejl-AI-stöd. Som att kunna prata med Notion-AI:n för att hantera sina mejl, boka möten i Notions kalender och skriva färdiga snabbsvar på mejl.

Den som är sugen på hur Notions mejlupplevelse kommer att se ut och fungera får dock hålla sig till tåls lite till (ja, eller gå in i artikeln och ta del av exemplen där). Den nya appen är planerad att landa ”tidigt 2025”.

Notion is making a super customizable email app

Briljant reklam för ChatGPT-utmanaren Claude

Ha!

 

AR/VR

Metas smarta solglasögon säljer bättre än Ray-Bans övriga modeller

Lite kul – och för mig faktiskt oväntat: Metas smarta-solglasögon-samarbete med Ray-Ban (ja, eller ägaren EssilorLuxottica) säljer bra. Riktigt bra till och med. Så pass att Meta-modellen är den mest sålda produkten i 60 % av alla Ray-Ban-butiker i Europa, Mellanöstern och Afrika.

Det kanske mest intressanta i sammanhanget är att glasögonen alltså även säljer bra i EU, där Meta inte har lanserat AI-funktionerna här (på grund av att EU:s regelverk kring AI ”saknar tydlighet”). Med andra ord så betyder det att EU-kunder är så sugna på att få solglasögon att de har hackat sig runt begränsningarna här hos oss.

Ja, eller att de flesta som köper Metas glasögon… inte bryr sig särskilt mycket om just AI-funktionerna. Utan istället köper den för möjligheten att spela in video och ta bilder till Instagram utan mobilen.

Oavsett, oväntat besked för mig. Blir intressant att följa utvecklingen för dem. Inte minst som att Meta rätt uttalat är väldigt sugna på att storsatsa på uppkopplade ”vanliga” glasögon som nästa försök att försöka minska beroendet av Apple och Google.

Meta’s smart glasses outsell traditional Ray-Bans in some stores, even before AI features roll out


Prenumerera på mitt nyhetsbrev

Jag gillar Olas digitala spaningar!

Gillar du det jag gör? Visa gärna din uppskattning genom att donera lite pengar. Det hjälper till att betala för webbhotell och andra kostnader.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *