Kategorier
AI - Artificiell intelligens Spaningar

Digitala spaningar vecka 49 2024 – del 2

Amazon introducerar en egen familj AI-modeller. Microsoft rullar ut Copilot Vision som kan se och förstå din skärm. Google rullar ut AI-videofunktionen Veo. Google släpper AI för att skapa spelbara världar från en enda bild.

Spaningar inom tech och sociala medier från veckan som har gått.

Övriga delar i veckans sammanställning

 

AI – artificiell intelligens

Amazon introducerar sin egen familj AI-modeller

Fler AI-modeller för den som inte kan få nog. Den här gången från den techjätte som överlag har legat rätt lågt på AI-området: Amazon.

Nu har Amazon släppt inte bara en utan tre olika modeller under paraplynamnet Nova. Och som hos konkurrenterna så spänner modellerna från snabbt och enkelt till långsamt och avancerat. Ja, lite förenklat. Nova Micro, Lite och Pro. Dessutom ska en värstingmodell lanseras i början av 2025: Premier.

Amazon passar också på att släppa tjänster byggda på Nova: Canvas, en AI-bildskapare och Reel, som inte inte oväntat är en videofunktion.

Amazon kommer senare nästa år följa upp med en egen tal-till-tal-modell (som sannolikt lär handla om realtidsöversättning) och en “native multimodal-to-multimodal”-historia.

Sist men inte minst fördjupar Amazon sitt samarbete med Open AI-konkurrenten Anthropic. Och tar upp kampen mot Elon Musks AI-bolag xAI. De båda företagen bygger ett “enormt AI-datakluster”.

Amazon announces Nova, a new family of foundation AI models developed with Anthropic

Apple använder Amazon-chip för sin AI-satsning

Det här är lite intressant. Och oväntat. Vem vänder sig Apple till för chip för sin AI-satsning? Amazon.

På sätt och vis är det inte helt oväntat. Apple har använt Amazons molntjänst AWS i över ett årtionde för Siri, kartjänsten och Apple Music. Men det förvånar mig ändå att Apple ser ut att kunna välja Amazon även som leverantör av AI-chip.

Enligt Amazon så planerar Apple att testköra Amazons anpassade Trainium2-chip för att träna sin AI-plattform Apple Intelligence. Men även för “andra modeller”, intressant nog.

Pratar vi AI-chip så är företagen som nämns oftast, i fallande ordning, Nvidia, Nvidia och Nvidia. Att Apple inte hoppar på Nvidia-tåget är däremot inte särskilt oväntat. Apple har inte varit stor Nvidia-kund.

Däremot har Amazon inte gjort särskilt mycket väsen av sig på just AI-chipområdet. Det återstår att se hur de står sig i konkurrensen. Men Apple och Amazon kan alltså komma att utgöra en väldigt oväntad AI-allians.

Apple Reportedly Testing Amazon’s Trainium2 AI Chips Amid Major AI Push

Microsoft sparkar hela teamet som jobbar med etisk AI-utveckling

Ett tecken i tiden. Inte minst pådrivet av vad som händer hos Open AI. Behovet av att springa jättejättejättefort med AI-utvecklingen gör att vissa aspekter får stryka på foten. Som säkerhet och etik.

Microsoft har nu sparkat hela teamet som arbetar (ja, eller arbetade) med “etik och samhälle” inom ramen för AI-verksamheten.

Microsoft själva argumenterar att de fortfarande har ett “Office of responsible AI” som har som uppgift att “skapa regler och principer som ska styra företagets AI-initiativ”. Vilket förstås är bra.

Men den som nu har fått gå hade, enligt intervjuer med några av dem, ett mer handgripligt ansvar. Att tolka de reglerna och se till att de efterlevs i de produkter som tas fram.

Kort sagt sannolikt ett ansvar som säkerligen kan ses som bromsklossigt. Ni vet: den interna företagsmotsvarigheten till suckande över att EU reglerar sönder Europas möjlighet att hänga med i AI-racet.

Som utomstående är det förstås svårt att se hur mycket teamet faktiskt bidrog med och vad skillnaden blir när de inte längre finns kvar. Men precis som när Open AI cirkusade runt för något år sedan – något som slutade med att just den avdelning som hade ansvar att säkerställa att AI inte förgör mänskligheten upplöstes – så är det ett lite oroväckande tecken att breakandet av saker blir ledstjärna snarare än diskussioner om man borde göra saker bara för att man kan.

En inställning som ironiskt nog lär leda till ännu fler regleringar. Därför att bolag även denna gång inte kan hålla fingrarna ur syltburkarna.

Microsoft lays off team that taught employees how to make AI tools responsibly

Microsoft lays off entire ethics and society team as it accelerates AI development

Microsoft rullar ut Copilot Vision som kan se och förstå din skärm

När Microsoft presenterade AI-nyheter i våras så var det stora utropstecknet Rewind-funktionen, som var ett fotografiskt minne över allt man gör i sin dator. Tanken var att man sedan ska kunna gå tillbaka och chatta om det med Copilot i efterhand. Den utrullningen har så här långt gått…. sådär.

Nu ska den vara på väg ut efter flera förseningar, men det återstår att se om den är utan större brister den här gången, eller om det fortfarande finns säkerhetshål kvar.

Men oavsett så är det nu dags för Microsoft att ge oss ett lillasyskon till Rewind: Copilot Vision. Det är förmågan hos Microsofts AI-bot att se och förstå din skärm. Motsvarigheten till det som såväl Google som Claude har på gång.

Det innebär att det ska gå att fråga om innehållet på en sajt, som att få en sammanfattning av en text, eller att be om hjälp i ett spel (eller ”fuska” som vi sa förr). Ja, okej, gällande det sista så ska man kunna ”få tips” om spel som schack när man spelar online – men jag kan läsa mellan raderna.

Men det finns ett stort problem med Vision. Ja, eller två.

Dels finns funktionen bara för Windows och dels så funkar den bara i Microsofts webbläsare Edge.

Så inte ens de som utsätter sig för Windows kommer alltså använda funktionen.

Microsoft’s Copilot Vision Preview Introduces AI That Understands On-Screen Content

Elon Musk vill stoppa Open AI:s omvandling till vinstdrivande bolag

När ChatGPT-ägaren en gång i tiden startade så var syftet att som icke-vinstdrivande organisation verka för utvecklingen inom AI. VD:n Sam Altman var en av dem som var med vid organisationens tillblivande. Elon Musk en av de andra.

Elon Musk klev dock av rätt tidigt i och med att han kände att Open AI var på väg åt fel håll. Han kände att initiativet att delvis låta Open AI bli vinstdrivande gick stick i stäv med det som sades när organisationen sjösattes. Musk kände att han var med och finansierade en startup utan att få någon ägarandel.

Sen var det inget mer med det. Förrän några år senare, när ChatGPT explodera och piskade upp den senaste AI-vågen. Då blev Musk sannolikt sur att de andra nu kunde casha in på den ekonomiska bottenplatta som han hade lagt.

I samband med att Musk sedan drog igång sitt eget AI-bolag xAI så stämde Musk Sam Altman för det “kontraktsbrott” som Open AI:s nya vinstväg innebar. Därefter drog Musk tillbaka stämning och skickade nästan omgående in en ny.

Nu är det dags för nästa kapitel: Open AI har uttalade planer att helt ställa om sin organisationsform till fullt ut vinstdrivande bolag, med en mindre icke-vinstdrivande del. Och det vill Musk nu sätta stopp för.

Enligt en begäran som Musk nu har skickat in så kräver han att en domstol ska sätta stopp för planerna, med argumentet att Open AI, tillsammans med Microsoft, bygger ett olagligt monopol.

Och det som kan vara ännu jobbigare för Sam Altman och Open AI i det här sammanhanget är att Musk som bekant har Trumps öra. Och i samband med nästa Trump-presidentperiod också har – i praktiken – formell och reell politisk makt.

Elon Musk Urges Court to Block Alleged Illegal For-Profit Conversion of OpenAI

Claude får ny Google Docs-integration

ChatGPT-utmanaren Claude får ny förmåga. Ja, eller mer specifikt en ny integration. Till Google Docs.

Det innebär att den som betalar för Claude nu kan länka direkt till dokument i Googles tjänst som del i det som man vill att Claude ska göra.

Så ja, egentligen gör det bara det snäppet enklare att arbeta med Google-dokument. Istället för att klistra in text eller ladda upp dokument manuellt så kan man bara skicka in Claude till dokumenten där de ligger hos Google. Men det är precis den här typen av tröskelsänkningar som behövs för att AI-teknik på riktigt ska bli en del av den stora massans (arbets)vardag.

Claude AI Introduces Powerful New Features: Google Docs Integration and Personalization

Google rullar ut AI-videofunktionen Veo

Så har det blivit dags för Google att ta fram en ny AI-funktion dedikerad för video: Veo. En som ska kunna skapa ”med hög kvalitet” i 1080p-upplösning. Och ungefär som vanligt så kan med den här typen av tjänster skapa videos baserat på textinstruktioner. Det finns ingen tydlig tidsgräns, men vi kan tänka att det även här är väldigt korta klipp som gäller.

Däremot är det inte en konsumenttjänst vi pratar om. Det som nu rullas ut är stöd för att företag kan börja bygga in den. Och det är – som ofta när AI-verktyg släpps nuförtiden – en ”förhandsversion” som det handlar om.

Och som AV EN HÄNDELSE börjar Google nu rulla ut Veo precis när det ryktas att Open AI ska släppa sin egen videomotsvarighet Sora som del av den julkalender som ChatGPT-ägaren sparkade igång igår. Där vi ska få en produktnyhet eller demonstration under 12 dagar.

Google’s Veo generative AI video model now available in preview

Chrome får AI-sammanfattning som visar hur pålitlig en handlare är

Intressant ny funktion på väg till Chrome: en sammanfattning kring hur pålitlig en handlare är.

Det ser ut som att Google mashar ihop de omdömen som finns från olika recensionssajter (som Trustpilot) och ger ett samlad överblick av vad kunder har sagt. Ännu ett Google-initiativ att försöka se till att färre människor blir blåsta, alltså. Inte minst i Blacknånting-tider.

Google bygger vidare på den funktion som har funnits rätt länge och varnat för saker som potentiellt bedrägliga sajter när man försöker gå in på en URL. Funktionen byter dock namn när den nu utökas. Från Protective protection till AI-powered protection. Because AI.

För det här hade förstås gått att göra helt utan AI, genom att helt enkelt bara hämta in och lista upp snittbetyg från olika omdömestjänster. Men det hade inte alls varit lika coolt. Eller åtminstone inte något man hade kunnat kalla “AInånting”.

Så i praktiken lär Google göra ungefär som Amazon gör med användares produktrecensioner: göra en sammanfattning av de bra och dåliga grejer som användare oftast nämner.

Google Chrome’s new AI feature helps you quickly check a website’s trustworthiness

The Browser Company presenterar en ny AI-webbläsare

AI-tjänster i all ära, men det som verkar vara mest inne just nu bland AI-bolagen – åtminstone som ett försök att bredda sig – är att ta fram en egen webbläsare.

Bara för ett par veckor sedan kom uppgifter om att ChatGPT-ägaren Open AI håller på att titta på precis det här – och nu är det dags för ännu ett sökbolag att ta det klivet: The Browser Company. Ja, eller att AI:fiera sin befintliga webbläsare ännu mer.

Företaget är mest kända för sin AI-sökmotor Arc Search, men har även tagit fram sin Arc Browser för den som vill gå lite mer all in på Arcs tjänster. Och nu är det dags för nästa generation webbläsare: Dia.

Dia verkar dessutom vara en kombination av “vanlig” AI-söktjänst och AI-agent. Den kan alltså söka på nätet och ge svar baserat på vad den hittar där, men kan också ta en lista med Amazon-produkter som du får på mejlen och lägga samtliga dessa i din Amazon-varukorg.

Hur bra den är på det här i praktiken? Det återstår att se. Och vi behöver kanske inte vänta särskilt länge för att kunna testa. Planen är att Dia ska lanseras “tidigt nästa år”.

The Browser Company teases Dia, its new AI-powered web browser

World Labs skapar interaktiva 3D-miljöer från stillbilder

Nästa stora grej för den som fortfarande jagar domäner med förhoppningen att kunna tjäna pengar på att sälja dem? Dammsug upp alla kombinationer av ”world” och ”.ai”. Senaste exemplet: World Labs. En gen AI-modell som skapar interaktiva 3D-miljöer från bara en stillbild.

Det handlar med andra ord om den del inom AI-världen som heter, tja, ”värld”. World, alltså. Ai-tjänster som kan gå bortom vanligt 2D-skapande – och till och med begränsat 3D-skapande av objekt – till att kunna skapa hela världar. Eller åtminstone hela scener och miljöer som går att interagera med. Som spelvärldar som går att vandra runt i. ”Outpainting” fast i 3D-världsversion.

Okej, det kan förstås vara mycket 2D även när det blir typ 3D. Som att de flesta som spelar spel fortfarande gör det med 2D-skärmar, även om man kan gå runt i en världar som har upplevt djup. Men nu ska vi inte haka upp oss på detaljer.

De skapade miljöerna går sedan att justera. Som att begränsa ”skärpedjupet” i världen, byta färg på föremål eller eller ljusets vinklar. De miljöer som skapas via World Labs lösning ska sedan vara konsekventa vid varje efterföljande användning.

Det är med andra ord Roblox the next generation. En tjänst för att snabbare kunna skapa färdiga världar, som dessutom får fysikens lagar med på köpet.

Precis som är fallet med de mer resursintensiva formaten (som video och musik) så blir det en begränsad ”värld” som skapas. Man kan alltså inte traska runt särskilt länge förrän man bokstavligen talat springer in i en vägg.

Men så är World Labs lösning fortfarande bara en ”tidig förhandsvisning”. Precis som den här AI-disciplinen överlag. Men det är ännu ett område där vi lär se både en rasande utveckling och många intressanta användningar.

World Labs’ AI can generate interactive 3D scenes from a single photo

Google släpper AI för att skapa spelbara världar från en enda bild

Alltså, ibland synkar techbolagen sina produktnyheter lite för mycket för att det ska kännas som rena slumpar. I början av veckan presenterade World Labs en lösning som kan skapa interaktiva scener, som för spel, från en enda bild. Vi vill också vara med och leka, tänkte Google. Och släpper nu en egen motsvarighet.

Mer formellt så är det Googles AI-verksamhet DeepMind (eller om vi ska vara ännu mer formella: Googles moderbolag Alphabets AI-verksamhet) som nu ger oss Genie 2. Och även den kan alltså skapa virtuella bilder bara från en bild. Ja, plus en text om vad man vill ha för slags 3D-spelvärld.

Precis som World Labs så ska nya Genie kunna hantera fysiska regler för de spelvärldar som skapas och kunna lägga på ljus och annat rätt placerat. Genie ska dessutom kunna “hantera interaktioner” och till och med hur NPC:s – alltså datorkontrollerade statister som dyker upp i ett spel – ska bete sig. Och man ska kunna “spela” och därmed interagera med den skapade världen.

Och precis som World Labs (och för den delen även andra liknande initiativ) så kan du dock inte förvänta dig att få en fullständig spelvärld som kan ge 100+ speltimmar. Genie kan skapa spelvärldar och miljöer som totalt blir en minut långa. Så, ja, väldigt korta spel.

Men den här typen av AI-lösningar – så kallad world AI just eftersom de skapar fullständiga, virtuella världar – är oavsett vansinnigt coola.

DeepMind’s Genie 2 can generate interactive worlds that look like video games


Prenumerera på mitt nyhetsbrev

Jag gillar Olas digitala spaningar!

Gillar du det jag gör? Visa gärna din uppskattning genom att donera lite pengar. Det hjälper till att betala för webbhotell och andra kostnader.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *